System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图像识别,尤其涉及一种分子结构识别方法、装置、电子设备和存储介质。
技术介绍
1、化学分子结构识别,可广泛应用在包括制药研发、人机交互、生物化学、教育、有机合成等领域。
2、目前,针对手写化学分子结构识别的研究,过度依赖基于规则的后处理方法,简化了分子结构识别本身的复杂性,导致手写的复杂分子布局在现有方案下难以完成解析识别。
技术实现思路
1、本专利技术提供一种分子结构识别方法、装置、电子设备和存储介质,用以解决现有技术中面向复杂的手写分子结构识别困难的缺陷。
2、本专利技术提供一种分子结构识别方法,包括:
3、获取分子图像;
4、初始化空的角度集合,在基于所述分子图像的图像特征进行分子结构解码、并首次解码到分支角度的情况下,将所述分支角度存入所述角度集合;从所述角度集合中取出一个分支角度,以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,并基于解码得到新的分支角度更新所述角度集合以供下一分支角度下的分子结构解码,直至所述角度集合为空;
5、基于各分支角度下的解码结果,确定所述分子图像对应的分子结构。
6、根据本专利技术提供的一种分子结构识别方法,所述基于解码得到新的分支角度更新所述角度集合,包括:
7、将所述新的分支角度分别与所述角度集合中的各已有分支角度,进行化学键检测;
8、基于所述化学键检测的检测结果,更新所述角度集合。
10、在所述检测结果指示不存在化学键的情况下,将所述新的分支角度存入所述角度集合;
11、在所述检测结果指示存在化学键的情况下,将与所述新的分支角度构成化学键的分支角度从所述角度集合中删除。
12、根据本专利技术提供的一种分子结构识别方法,所述以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,包括:
13、基于所述分支角度的解码特征,以及所述分支角度下的前一个解码时刻的解码状态,确定所述分支角度下的当前解码时刻的视觉上下文特征;
14、基于所述视觉上下文特征,对所述图像特征进行当前解码时刻的分子结构解码,得到当前解码时刻的解码状态,并将所述当前解码时刻作为前一个解码时刻返回解码,直至所述分支角度下的解码结束。
15、根据本专利技术提供的一种分子结构识别方法,所述从角度集合中取出一个分支角度,以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,并基于解码得到新的分支角度更新所述角度集合以供下一分支角度下的分子结构解码,直至所述角度集合为空,包括:
16、基于识别模型,从角度集合中取出一个分支角度,以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,并基于解码得到新的分支角度更新所述角度集合以供下一分支角度下的分子结构解码,直至所述角度集合为空;
17、所述识别模型基于样本图像、以及所述样本图像对应的分子结构标签训练得到;
18、所述分子结构标签是将所述样本图像对应的分子式中的原子群和化学键连接成分子结构图之后进行图遍历得到。
19、根据本专利技术提供的一种分子结构识别方法,所述分子结构标签的确定步骤包括:
20、将所述样本图像对应的分子式中的原子群和化学键连接成分子结构图;
21、遍历所述分子结构图,并基于遍历所得的原子群、化学键、角度、嵌套符号和重连标记生成所述分子结构标签。
22、根据本专利技术提供的一种分子结构识别方法,所述识别模型的训练步骤包括:
23、基于初始模型,对所述样本图像进行分子结构识别,得到所述分子结构识别过程中解码到的样本分支角度与样本角度集合中已有分支角度之间的化学键检测结果,以及所述样本图像的结构识别结果;
24、基于所述结构识别结果和所述分子结构标签,以及所述化学键检测检测和所述分子结构标签中的重连标记,对所述初始模型进行参数迭代,得到所述识别模型。
25、本专利技术还提供一种分子结构识别装置,包括:
26、获取单元,用于获取分子图像;
27、识别单元,用于初始化空的角度集合,在基于所述分子图像的图像特征进行分子结构解码、并首次解码到分支角度的情况下,将所述分支角度存入所述角度集合;从所述角度集合中取出一个分支角度,以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,并基于解码得到新的分支角度更新所述角度集合以供下一分支角度下的分子结构解码,直至所述角度集合为空;
28、输出单元,用于基于各分支角度下的解码结果,确定所述分子图像对应的分子结构。
29、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述分子结构识别方法。
30、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述分子结构识别方法。
31、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述分子结构识别方法。
32、本专利技术提供的分子结构识别方法、装置、电子设备和存储介质,增加了对于化学分子结构中各个分支角度的解码和待探索的分支角度的维护机制,并将化学分子结构中的分支角度作为解码时的引导条件,以丰富分子结构解码的信息,提高分子结构解码的可靠性,提高面向复杂化学分子结构的解码准确性。
本文档来自技高网...【技术保护点】
1.一种分子结构识别方法,其特征在于,包括:
2.根据权利要求1所述的分子结构识别方法,其特征在于,所述基于解码得到新的分支角度更新所述角度集合,包括:
3.根据权利要求2所述的分子结构识别方法,其特征在于,所述基于所述化学键检测的检测结果,更新所述角度集合,包括:
4.根据权利要求1所述的分子结构识别方法,其特征在于,所述以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,包括:
5.根据权利要求1至4中任一项所述的分子结构识别方法,其特征在于,所述从所述角度集合中取出一个分支角度,以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,并基于解码得到新的分支角度更新所述角度集合以供下一分支角度下的分子结构解码,直至所述角度集合为空,包括:
6.根据权利要求5所述的分子结构识别方法,其特征在于,所述分子结构标签的确定步骤包括:
7.根据权利要求5所述的分子结构识别方法,其特征在于,所述识别模型的训练步骤包括:
8.一种分子结构识别装置,
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述分子结构识别方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述分子结构识别方法。
...【技术特征摘要】
1.一种分子结构识别方法,其特征在于,包括:
2.根据权利要求1所述的分子结构识别方法,其特征在于,所述基于解码得到新的分支角度更新所述角度集合,包括:
3.根据权利要求2所述的分子结构识别方法,其特征在于,所述基于所述化学键检测的检测结果,更新所述角度集合,包括:
4.根据权利要求1所述的分子结构识别方法,其特征在于,所述以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,包括:
5.根据权利要求1至4中任一项所述的分子结构识别方法,其特征在于,所述从所述角度集合中取出一个分支角度,以所述分支角度为引导,基于所述分子图像的图像特征对所述分支角度下的分子结构进行解码,并基于解码得到新的分支角度更...
【专利技术属性】
技术研发人员:胡金水,吴浩,陈明军,刘辰宇,殷实,吴嘉嘉,殷保才,殷兵,刘聪,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。