基于化学结构式的检索方法技术

技术编号:24013029 阅读:25 留言:0更新日期:2020-05-02 02:24
本发明专利技术公开了一种基于化学结构式的检索方法:绘制化学结构式;从标准官能团集中提取与绘制的化学结构式包含的官能团相一致的标准官能团,并存储至提取官能团集中;从专利文献集中提取含有化学结构式的专利文献;以提取官能团集中的标准官能团为检索要素构建检索式;根据检索式集中的检索式在化学结构式专利文献集中进行检索,并存储检索结果,构建检索结果集;从检索结果集中抽查文献,构成抽查文献集,将抽查文献集中与绘制的化学结构式相关的文献数量与抽查文献集中的文献数量作比较,得到比值,当比值大于阀值时输出检索结果集,当比值小于阀值时去噪检索。本发明专利技术可针对化学结构式进行检索,检索结果噪声较低、准确率较高。

Retrieval method based on chemical structural formula

【技术实现步骤摘要】
基于化学结构式的检索方法
本专利技术涉及检索方法,尤其涉及一种基于化学结构式的检索方法。
技术介绍
化学结构式是表示用元素符号和短线表示化合物(或单质)分子中原子的排列和结合方式的化学组成式,是一种简单描述分子结构的方法。由于有机化合物中存在着同分异构现象,因此一个分子式可能代表两种或两种以上具有不同结构的物质,只能通过化学结构式加以区分,在知道某一物质的分子式后,可利用该物质的特殊性质,通过定性或定量实验来确定其化学结构式。现有的检索方法,可通过输入检索式来检索相关专利文献,输入的检索要素为申请人、分类号、关键词等,化学领域的关键词包含分子式,而一个分子式可能包含多种物质,且性质往往也不一样。比如各种有机物的同分异构体,分子式相同,但是结构式不一样,就显示出性质的差异。更不必说相同化学式的不同类物质,比如二甲醚和乙醇的分子式均为C2H6O,但其结构不同。综上所述,现有的检索方法缺乏针对化学结构式的检索,造成检索结果噪声过大,准确率较低。
技术实现思路
根据现有技术存在的问题,本专利技术公开了一种基于化学结构式的检索方法,具有如下步骤:S1、在输入单元上绘制化学结构式;S2、将绘制的化学结构式与标准官能团集中的标准官能团作比较,从标准官能团集中提取与绘制的化学结构式包含的官能团相一致的标准官能团,并存储至提取官能团集中;S3、从专利文献集中提取含有化学结构式的专利文献,并存储至化学结构式专利文献集;S4、以提取官能团集中的标准官能团为检索要素构建检索式,并存储至检索式集中;S5、根据检索式集中的检索式在化学结构式专利文献集中进行检索,并存储检索结果,构建检索结果集;S6、从检索结果集中抽查文献,构成抽查文献集,将抽查文献集中与绘制的化学结构式相关的文献数量与抽查文献集中的文献数量作比较,得到比值,当比值大于阀值时执行S8,当比值小于阀值时执行S7;S7、从抽查文献集中与绘制的化学结构式不相关的文献中提取噪声官能团,并从检索式集中的检索式中去除噪声官能团,得到去燥检索式集,并根据去燥检索式集中的检索式在化学结构式专利文献集中进行检索,检索结果替换在检索结果集内的检索结果;S8、输出检索结果集。所述输入单元为画板模块。所述输入单元包括扫描模块和化学结构式识别模块,所述扫描模块用于扫描纸张上的绘制图形,所述化学结构式识别模块用于识别绘制图形中的化学结构式。所述阀值为0.90。通过输出单元输出检索结果集,所述输出单元包括用于显示检索结果集的显示模块。从检索结果集中抽查文献可按申请日、进入国家进行抽取。与现有技术相比,本专利技术可针对化学结构式进行检索,检索结果噪声较低、准确率较高。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的具体实施方式中基于化学结构式的检索方法的流程图。具体实施方式为使本专利技术的技术方案和优点更加清楚,下面结合本专利技术实施例对本专利技术中的技术方案进行清楚完整的描述:一种基于化学结构式的检索方法,具有如下步骤:S1、在输入单元上绘制化学结构式;所述输入单元包括扫描模块和化学结构式识别模块,所述扫描模块用于扫描纸张上的绘制图形,所述化学结构式识别模块用于识别绘制图形中的化学结构式。所述扫描模块得到绘制图形,将其灰度化处理并进行边缘提取,获取绘制图形的边缘信息,根据绘制图形的边缘信息去除绘制图形的边缘,得到去边缘的绘制图形;所述化学结构式识别模块提取去边缘的绘制图形中的化学结构式。S2、将绘制的化学结构式与标准官能团集中的标准官能团作比较,从标准官能团集中提取与绘制的化学结构式包含的官能团相一致的标准官能团,并存储至提取官能团集中;常见的标准官能团为碳羟基、羧基、醚键、醛基、羰基等S3、从专利文献集中提取含有化学结构式的专利文献,并存储至化学结构式专利文献集;S4、以提取官能团集中的标准官能团为检索要素构建检索式,并存储至检索式集中;S5、根据检索式集中的检索式在化学结构式专利文献集中进行检索,并存储检索结果,构建检索结果集;S6、从检索结果集中抽查文献,构成抽查文献集,将抽查文献集中与绘制的化学结构式相关的文献数量与抽查文献集中的文献数量作比较,得到比值,当比值大于0.90时执行S8,当比值小于0.90时执行S7;类如,抽查文献集中的文献数量为10,其中有8个文献与检索策略相关,则比值为0.8;S7、从抽查文献集中与绘制的化学结构式不相关的文献中提取噪声官能团,并从检索式集中的检索式中去除噪声官能团,得到去燥检索式集,并根据去燥检索式集中的检索式在化学结构式专利文献集中进行检索,检索结果替换在检索结果集内的检索结果;S8、输出检索结果集,通过输出单元输出检索结果集,所述输出单元包括用于显示检索结果集的显示模块。从检索结果集中抽查文献可按申请日、进入国家进行抽取。以上所述,仅为本专利技术较佳的具体实施方式,但本专利技术的保护范围并不局限于此,任何熟悉本
的技术人员在本专利技术揭露的技术范围内,根据本专利技术的技术方案及其专利技术构思加以等同替换或改变,都应涵盖在本专利技术的保护范围之内。本文档来自技高网
...

【技术保护点】
1.一种基于化学结构式的检索方法,其特征在于具有如下步骤:/nS1、在输入单元上绘制化学结构式;/nS2、将绘制的化学结构式与标准官能团集中的标准官能团作比较,从标准官能团集中提取与绘制的化学结构式包含的官能团相一致的标准官能团,并存储至提取官能团集中;/nS3、从专利文献集中提取含有化学结构式的专利文献,并存储至化学结构式专利文献集;/nS4、以提取官能团集中的标准官能团为检索要素构建检索式,并存储至检索式集中;/nS5、根据检索式集中的检索式在化学结构式专利文献集中进行检索,并存储检索结果,构建检索结果集;/nS6、从检索结果集中抽查文献,构成抽查文献集,将抽查文献集中与绘制的化学结构式相关的文献数量与抽查文献集中的文献数量作比较,得到比值,当比值大于阀值时执行S8,当比值小于阀值时执行S7;/nS7、从抽查文献集中与绘制的化学结构式不相关的文献中提取噪声官能团,并从检索式集中的检索式中去除噪声官能团,得到去燥检索式集,并根据去燥检索式集中的检索式在化学结构式专利文献集中进行检索,检索结果替换在检索结果集内的检索结果;/nS8、输出检索结果集。/n

【技术特征摘要】
1.一种基于化学结构式的检索方法,其特征在于具有如下步骤:
S1、在输入单元上绘制化学结构式;
S2、将绘制的化学结构式与标准官能团集中的标准官能团作比较,从标准官能团集中提取与绘制的化学结构式包含的官能团相一致的标准官能团,并存储至提取官能团集中;
S3、从专利文献集中提取含有化学结构式的专利文献,并存储至化学结构式专利文献集;
S4、以提取官能团集中的标准官能团为检索要素构建检索式,并存储至检索式集中;
S5、根据检索式集中的检索式在化学结构式专利文献集中进行检索,并存储检索结果,构建检索结果集;
S6、从检索结果集中抽查文献,构成抽查文献集,将抽查文献集中与绘制的化学结构式相关的文献数量与抽查文献集中的文献数量作比较,得到比值,当比值大于阀值时执行S8,当比值小于阀值时执行S7;
S7、从抽查文献集中与绘制的化学结构式不相关的文献中提取噪声官能团,并从检索式集中的检索式中去除噪声官能团,得到去燥检索式集,并...

【专利技术属性】
技术研发人员:孙文新
申请(专利权)人:大连神奇视角网络科技有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1