分子结构提取方法、装置及设备制造方法及图纸

技术编号:38228713 阅读:32 留言:0更新日期:2023-07-25 17:57
本申请涉及一种分子结构提取方法和装置、分子结构数据集设备、电子设备及计算机可读存储介质,该方法包括:获取待识别分子结构的原始图像;根据多个预设光学结构识别工具分别识别所述原始图像中的待识别分子结构,获得对应的候选分子结构;将各候选分子结构相互进行比较,当至少部分所述候选分子结构不一致时,筛选出与原始图像中的待识别分子结构接近的候选分子结构作为识别结果。本申请提供的方案,能够快速且准确地提取文献中的分子结构,节约人力资源,提高信息收集效率。提高信息收集效率。提高信息收集效率。

【技术实现步骤摘要】
分子结构提取方法、装置及设备


[0001]本申请涉及化学图像识别
,尤其涉及一种分子结构提取方法、装置及设备。

技术介绍

[0002]科学研究结果通常以文章或专利的形式发表,在合成化学、天然药物研究、药物发现以及其他诸多领域中,阅读文献是获取医药研发信息最普遍的方式。据统计,出版化学类文章的学术期刊有近万家,每年公开的新化学结构超过两万个。药物研发者可以基于文献中公开的分子结构和活性数据进行分析,进而推动下一步的药物开发工作。
[0003]然而,大量的分子结构信息是隐藏在文献当中,需要专业人员阅读文献,手动绘制分子结构,导致耗费大量的人力和时间进行汇集,效率低下。

技术实现思路

[0004]为解决或部分解决相关技术中存在的问题,本申请提供一种分子结构提取方法和装置、分子结构数据集设备、电子设备及计算机可读存储介质,能够快速且准确地提取文献中的分子结构,节约人力资源,提高信息收集效率。
[0005]本申请第一方面提供一种分子结构提取方法,其包括:
[0006]获取待识别分子结构的原始图像;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分子结构提取方法,其特征在于,包括:获取待识别分子结构的原始图像;根据多个预设光学结构识别工具分别识别所述原始图像中的待识别分子结构,获得对应的候选分子结构;将各候选分子结构相互进行比较,当至少部分所述候选分子结构不一致时,筛选出与原始图像中的待识别分子结构接近的候选分子结构作为识别结果。2.根据权利要求1所述的方法,其特征在于,所述将各候选分子结构相互进行比较,包括:对各所述候选分子结构进行同一性判别,根据判别结果是否一致设置待识别分子结构对应的判别标记。3.根据权利要求2所述的方法,其特征在于,所述当至少部分所述候选分子结构不一致时,筛选出与原始图像中的待识别分子结构接近的候选分子结构作为识别结果,包括:当所述判别标记为表示结构不一致的非一致性标记时,分别评估各所述候选分子结构与对应的原始图像中的分子结构的相似度;根据各候选分子结构与原始图像中的分子结构的相似度,将相似度最高的候选分子结构作为待识别分子结构的识别结果。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:当各候选分子结构全部一致时,确定所述候选分子结构为待识别分子结构的识别结果。5.根据权利要求1或4所述的方法,其特征在于,所述方法还包括:按照预设结构格式,分别将各待识别分子结构的识别结果进行存储,获得分子结构数据集。6.根据权利要求1所述的方法,其特征在于,所述获取待识别分子结构的原始图像,包括:将预设格式的原始文件进行分页处理,获得对应的分页文件;将分页文件中的各待识别分子结构分割为独立的图像,分别生成待识别分子结构对应的原始图像。7.根据权利要求6所述的方法,其特征在于,所述分别将分页文件中的各待识别分子结构分割为独立的图像,生成待识别分子结构的原始图像,包...

【专利技术属性】
技术研发人员:张启花陈照强
申请(专利权)人:深圳晶泰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1