【技术实现步骤摘要】
一种基于变换神经网络的小分子化学结构图像识别方法
[0001]本专利技术属于图像处理
,具体涉及一种基于变换神经网络的小分子化学结构图像识别方法。
技术介绍
[0002]小分子药物的应用领域非常广泛,可用于肿瘤、神经系统、感染、代谢、心血管类疾病、非中枢性止痛、退热、抗炎、免疫或过敏性疾病、皮肤病、消化系统疾病和骨骼疾病等方面。据统计,在常用药物中,小分子药物的数量可占总量的98%。在生命科学的数据管理领域中,从公开的资源(如:期刊论文和专利)中提取化学结构一直是困难和耗时的。近年来,随着以深度学习算法为基础的计算机视觉和自然语言处理技术得到快速发展,利用深度学习技术从图像中提取出有价值的信息得到越来越广泛的应用。深度神经网络能自动提取特征,并且在化学结构图像上具有较好的鲁棒性和泛化能力。由于许多小分子相关文献中的小分子化合物的结构细节以JPEG、PNG、GIF及BMP等图像格式呈现,失去了原有的化学意义。自动分析这些化学结构图像并将其转换为计算机可识别格式,如SMILES表示法,对于小分子药物的分析与发现有实际的应用 ...
【技术保护点】
【技术特征摘要】
1.一种基于变换神经网络的小分子化学结构图像识别方法,其特征在于,包括以下步骤:S1:获取小分子化学结构图像,并对小分子化学结构图像进行预处理;S2:将预处理后的小分子化学结构图像作为MobileViT_2网络的输入,提取小分子化学结构图像的特征向量;S3:获取原始SMILES序列,将其作为标签并和小分子化学结构图像的特征向量共同作为Conditional DETR网络解码部分的输入,得到SELFIES序列,并通过selfies程序包转换成新的SMILES序列,作为识别结果,完成小分子化学结构图像识别。2.根据权利要求1所述的基于变换神经网络的小分子化学结构图像识别方法,其特征在于,所述步骤S1中,对小分子化学结构图像进行预处理的具体方法为:将小分子化学结构图像转换为RGB图像,并对其进行随机旋转。3.根据权利要求1所述的基于变换神经网络的小分子化学结构图像识别方法,其特征在于,所述步骤S2中,MobileViT_2网络包括依次连接的第一卷积模块、第一MobileV2 block模块、第二MobileV2 block模块、第三MobileV2 block模块、第四MobileV2 block模块、第五MobileV2 block模块、第一MobileViT_2block模块、第六MobileV2 block模块、第二MobileViT_2block模块、第七MobileV2 block模块、第三MobileViT_2block模块、第二卷积模块和平均池化模块。4.根据权利要求3所述的基于变换神经网络的小分子化学结构图像识别方法,其特征在于,所述第一MobileV2 block模块、第二MobileV2 block模块、第三MobileV2 block模块、第四MobileV2 block模块和第五MobileV2 block模块用于提取小分子化学结构图像的特征信息;其中,第二MobileV2 block模块和第五MobileV2 block模块还用于对...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。