分子筛选的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33650011 阅读:13 留言:0更新日期:2022-06-02 20:27
本公开提供了分子筛选的方法、装置、电子设备及存储介质,涉及人工智能技术领域中的深度学习技术领域、图论技术领域和生物与信息技术领域。其中方法为:获取待筛选分子的第一标签图和参考分子的第二标签图,每个待筛选分子与参考分子组成分子对,针对每个分子对,获取第一标签图和第二标签图的顶点之间的映射和映射之间的冲突信息,以生成分子对的映射图,对映射图进行采样,获取分子对的最大权重全连接子图,根据每个分子对的最大权重全连接子图,筛选出与参考分子相似度最大的待筛选分子,作为目标分子。提出了一种基于高斯玻色采样实现分子筛选的框架,从而能够应用高斯玻色采样高效地实现基于配体的药物虚拟筛选的问题,提高分子筛选的效率。提高分子筛选的效率。提高分子筛选的效率。

【技术实现步骤摘要】
分子筛选的方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
中的深度学习
、图论
和生物与信息
,尤其涉及一种分子筛选的方法、装置、电子设备及存储介质。

技术介绍

[0002]玻色采样是一种具有很强计算能力的近代量子光学算法,其原理是将相同的光子送入一个量子光学系统中,并使用光子计数器测量量子光学系统的输出态,高斯玻色采样作为玻色采样的延伸,可以被应用于解决图组合问题,然而如何更好的应用高斯玻色采样解决特定问题,增加高斯玻色采样的落地场景仍然是一个巨大的挑战,其中如何应用高斯玻色采样高效地实现基于配体的药物虚拟筛选,提高分子筛选的效果已经成为一个亟待解决的问题。

技术实现思路

[0003]提供了一种分子筛选的方法、装置、电子设备及存储介质。
[0004]根据第一方面,提供了一种分子筛选的方法,包括:获取待筛选分子集中待筛选分子的第一标签图和参考分子的第二标签图;每个所述待筛选分子与所述参考分子组成分子对,针对每个所述分子对,获取所述第一标签图和所述第二标签图的顶点之间的映射和所述映射之间的冲突信息,并基于所述映射和所述映射之间的冲突信息生成所述分子对的映射图;对所述映射图进行采样,获取所述分子对的最大权重全连接子图;根据每个所述分子对的最大权重全连接子图,从所述待筛选分子集中筛选出与所述参考分子相似度最大的待筛选分子,作为目标分子。
[0005]根据第二方面,提供了一种分子筛选的装置,包括:获取模块,用于获取待筛选分子集中待筛选分子的第一标签图和参考分子的第二标签图;映射模块,用于每个所述待筛选分子与所述参考分子组成分子对,针对每个所述分子对,获取所述第一标签图和所述第二标签图的顶点之间的映射和所述映射之间的冲突信息,并基于所述映射和所述映射之间的冲突信息生成所述分子对的映射图;采样模块,用于对所述映射图进行采样,获取所述分子对的最大权重全连接子图;筛选模块,用于根据每个所述分子对的最大权重全连接子图,从所述待筛选分子集中筛选出与所述参考分子相似度最大的待筛选分子,作为目标分子。
[0006]根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面所述的分子筛选的方法。
[0007]根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开第一方面所述的分子筛选的方法。
[0008]根据第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开第一方面所述分子筛选的方法的步骤。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1是根据本公开第一实施例的分子筛选的方法的流程示意图;
[0012]图2是根据本公开第二实施例的分子筛选的方法的流程示意图;
[0013]图3是根据本公开第三实施例的分子筛选的方法的流程示意图;
[0014]图4是根据本公开第四实施例的分子筛选的方法的流程示意图;
[0015]图5是根据本公开第五实施例的分子筛选的方法的流程示意图;
[0016]图6是根据本公开实施例的分子筛选的方法中生成分子的标签图的示意图;
[0017]图7是根据本公开第六实施例的分子筛选的方法的流程示意图;
[0018]图8是根据本公开第七实施例的分子筛选的方法的流程示意图;
[0019]图9为根据本公开实施例的分子筛选的方法的整体示意图;
[0020]图10是根据本公开第一实施例的分子筛选的装置的框图;
[0021]图11是根据本公开第二实施例的分子筛选的装置的框图;
[0022]图12是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
[0023]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0024]人工智能(ArtificialIntelligence,简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。目前,AI技术具有自动化程度高、精确度高、成本低的优点,得到了广泛的应用。
[0025]深度学习(Deep Learning,简称DL),是机器学习(Machine Learning,简称ML)领域中一个新的研究方向,学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。就具体研究内容而言,主要包括基于卷积运算的神经网络系统,即卷积神经网络;基于多层神经元的自编码神经网络;以多层自编码神经网络的方式进行预训练,进而结合鉴别信息进一步优化神经网络权值的深度置信网络。深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
[0026]图论(Graph Theory)是数学的一个分支。它以图为研究对象。图论中的图是由若干给定的点及连接两点的线所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物,用连接两点的线表示相应两个事物间具有这种关系。
[0027]生物技术(Biotechnology)是以生命科学为基础,利用生物(或生物组织、细胞及其他组成部分)的特性和功能,设计、构建具有预期性能的新物质或新品系,以及与工程原理相结合,加工生产产品或提供服务的综合性技术。信息技术(Information Science)是研究信息的获取、传输和处理的技术,由计算机技术、通信技术、微电子技术结合而成,即是利用计算机进行信息处理,利用现代电子通信技术从事信息采集、存储、加工、利用以及相关产品制造、技术开发、信息服务的新学科。信息技术和生物技术都是高新技术,二者在新经济中并非此消彼长的关系,而是相辅相成,共同推进21世纪经济的快速发展。
[0028]下面结合附图描述本公开实施例的分子筛选的方法、装置、电子设备及存储介质。
[0029]图1是根据本公开第一实施例的分子筛选的方法的流程示意图。...

【技术保护点】

【技术特征摘要】
1.一种分子筛选的方法,包括:获取待筛选分子集中待筛选分子的第一标签图和参考分子的第二标签图;每个所述待筛选分子与所述参考分子组成分子对,针对每个所述分子对,获取所述第一标签图和所述第二标签图的顶点之间的映射和所述映射之间的冲突信息,并基于所述映射和所述映射之间的冲突信息生成所述分子对的映射图;对所述映射图进行采样,获取所述分子对的最大权重全连接子图;根据每个所述分子对的最大权重全连接子图,从所述待筛选分子集中筛选出与所述参考分子相似度最大的待筛选分子,作为目标分子。2.根据权利要求1所述的方法,其中,获取任一分子对应的标签图,所述任一分子为所述待筛选分子或为所述参考分子,包括:根据所述任一分子的分子结构,生成所述任一分子的无向图,所述无向图中的顶点对应所述分子的单个原子或包含多个原子的环,所述无向图中的边对应所述分子中的化学键;提取所述任一分子中每个原子的特征,并基于提取的所述特征生成所述任一分子的特征标签集,其中所述特征标签集中包括所述单个原子的特征和所述环的特征,所述环的特征由所述环包含的多个原子的特征聚合得到;根据所述任一分子的无向图和特征标签集生成所述任一分子对应的标签图,其中,所述任一分子为所述待筛选分子,所述对应的标签图为所述第一标签图,所述任一分子为所述参考分子,所述对应的标签图为所述第二标签图。3.根据权利要求2所述的方法,其中,所述基于提取的所述特征生成所述任一分子的特征标签集,包括:识别提取到的所述特征的特征类型,并基于所述特征类型确定提取的所述特征的关键特征标签,所述关键特征标签指示所述特征是否为关键特征;基于提取的所述特征、所述特征的特征类型和所述特征的关键特征标签,生成所述特征标签集。4.根据权利要求3所述的方法,其中,所述分子为药物分子,所述特征类型包括加性化学特征、非加性化学特征和药学特征,所述非加性化学特征和药学特征为关键特征,所述加性化学特征为非关键特征。5.根据权利要求1

4任一项所述的方法,其中,所述针对每个所述分子对,获取所述第一标签图和所述第二标签图的顶点之间的映射和所述映射之间的冲突信息,并基于所述映射和所述映射之间的冲突信息生成所述分子对的映射图,包括:将所述第一标签图中的每个第一顶点,分别与所述第二标签图中的每个第二顶点进行关键特征匹配,以获取所述第一顶点和所述第二顶点之间的映射;从所有所述映射中获取无冲突的两个映射形成映射对,并在所述映射对包括的两个映射之间形成边;获取所述映射对应的权重;以所述映射为所述映射图的顶点、所述无冲突的映射对之间的边和所述映射的权重生成所述映射图。6.根据权利要求5所述的方法,其中,所述从所有所述映射中获取无冲突的两个映射形
成映射对,包括:从所有所述映射中选取两个映射,确定所述两个映射各自对应的第一顶点和第二顶点;获取所述两个映射各自对应的第一顶点所表征的第一原子或第一环;获取所述两个映射各自对应的第二顶点所表征的第二原子或第二环;响应于两个所述第一原子或第一环之间未存在原子冲突和距离冲突,且两个所述第二原子或第二环之间未存在原子冲突和距离冲突,则确定所述两个映射为无冲突的两个映射,并形成所述映射对。7.根据权利要求6所述的方法,其中,所述原子冲突的确定,包括:将两个所述第一原子或第一环进行原子比对,以及将两个所述第二原子或第二环进行原子比对;响应于两个所述第一原子或第一环中未存在同一原子,且两个所述第二原子或第二环中未存在同一原子,则确定所述两个映射未存在原子冲突。8.根据权利要求6所述的方法,其中,所述距离冲突的确定,包括:获取两个所述第一原子或第一环之间的第一距离;获取两个所述第二原子或第二环之间的第二距离;响应于所述第一距离与所述第二距离之间的差值小于或等于预设距离,则确定所述两个映射未存在距离冲突。9.根据权利要求5所述的方法,其中,基于关键特征匹配生成所述映射的过程,包括:获取其中一个第一顶点的第一关键特征,以及其中一个第二顶点的第二关键特征;判断所述第一关键特征与所述第二关键特征的属性是否相同;若存在至少一个关键特征的属性相同,则生成所述其中一个第一顶点与所述其中一个第二顶点之间的所述映射。10.根据权利要求5所述的方法,其中,所述获取所述映射对应的权重,包括:针对每个所述映射,确定所述映射对应的第一顶点和第二顶点,根据所述第一顶点和所述第二顶点各自的原子个数和特征,生成所述映射的权重,所述特征为所述顶点对应的原子或环的特征。11.根据权利要求10所述的方法,其中,所述根据所述第一顶点和所述第二顶点各自的原子个数和特征,生成所述映射的权重,包括:获取所述第一顶点的原子个数和所述第二顶点的原子个数的平均值;获取所述第一顶点和所述第二顶点之间属性或值相同的特征的个数;根据所述平均值和所述属性或值相同的特征的个数,确定所述第一顶点和所述第二顶点之间的所述映射的权重。12.根据权利要求1所述的方法,其中,所述对所述映射图进行采样,获取所述分子对的最大权重全连接子图,包括:基于高斯玻色采样算法对所述映射图进行采样,得到所述最大权重全连接子图。13.根据权利要求1所述的方法,其中,所述根据每个所述分子对的最大权重全连接子图,从所述待筛选分子集中筛选出与所述参考分子相似度最大的待筛选分子,作为目标分子,包括:
基于所述分子对的最大全连接图,获取所述分子对中所述待筛选分子和所述参考分子的标签图之间的相似度;从所述待筛选分子集中筛选出与所述参考分子相似度最大的待筛选分子,作为目标分子。14.根据权利要求13所述的方法,其中,所述基于所述分子对的最大全连接图,获取所述分子对中所述待筛选分子和所述参考分子的标签图之间的相似度,包括:获取所述第一标签图的第一总权重;获取所述第二标签图的第二总权重;基于所述最大权重全连接子图所包括顶点的权重,确定所述最大权重全连接子图的第三总权重;根据所述第一总权重、所述第二总权重和所述第三总权重,确定所述第一标签和所述第二标签图之间的相似度。15.一种分子筛选的装置,包括:获取模块,用于获取待筛选分子集中待筛选分子的第一标签图和参考分子的第二标签图;映射模块,用于每个所述待筛选分子与所述参考分子组成分子对,针对每个所述分子对,获取所述第一标签图和所述第二标签图的顶点之间的映射和所述映射之间的冲突信息,并基于所述映射和所述映射之间的冲突信息生成所述分子对的映射图;采样模块,用于对所...

【专利技术属性】
技术研发人员:周景博郑书豪窦德景
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1