一种人工智能AI深度学习技术驱动的药物筛选算法制造技术

技术编号:34051550 阅读:112 留言:0更新日期:2022-07-06 15:56
本发明专利技术提供了一种人工智能AI深度学习技术驱动的药物筛选算法,引入基于物理原理的端到端深度学习模型Molecule CapsNet进行虚拟筛选;在Molecule CapsNet中,基本的分子结构数据被输入网络,多体力场方程式用于分析出对预测配体结合力至关重要的特征值;然后将这些表达原子间相互作用的特征值分类为能量项;Molecule CapsNet结合了数据驱动法和物理原理法的预测能力,从最简单的输入数据即原子坐标和原子类型中连续学习更高阶的物理特征,并把配体亲和热力学循环整合到神经网络优化中,直接预测亲和自由能。本发明专利技术通过对现有化合物数据库信息的整合和数据提取、机器学习等手段,获得与化合物毒性、有效性相关的关键信息,从而大幅提高筛选的成功率,降低研发成本和工作量。作量。作量。

A drug screening algorithm driven by AI deep learning technology

【技术实现步骤摘要】
一种人工智能AI深度学习技术驱动的药物筛选算法


[0001]本专利技术涉及生物医药
,尤其涉及药物设计领域,可用于药物筛选。

技术介绍

[0002]药物研发是漫长,昂贵和带有偶然性的过程。根据Tufts药物研发中心统计,每个新药研发成本大约26亿美元,周期大概十年,其中6

7年都是临床试验阶段,只有12%的药物可以通过临床验证。药物设计的复杂在于参数空间无比巨大,理论上可能生成10
60
个不同分子。研究人员要从这么大的分子库中寻找针对靶蛋白的小分子先导药物,难度可想而知。目前高通量筛选技术每天可以筛选106个分子,价格不菲。任何可以加速这一研发过程的技术对整个行业链都有巨大影响。基于结构的计算机辅助药物筛选(即虚拟筛选)由于其低成本高效率的优势,正在逐步取代高通量筛选在药物研发中发挥巨大的作用。近年来AI深度学习技术在药物靶点发现、活性化合物筛选等新药发现环节已得到越来越广泛的应用。
[0003]虚拟筛选是一种从化合物数据库中分离出对靶标有活性的化合物的计算机模拟技术,成为药物筛选的发展趋势。虚拟筛选的中心任务是预测小分子配体与靶蛋白结合的亲和力。由于蛋白质

配体结合物中相互作用的复杂性,快速而准确地评估结合亲和力仍然是常规计算方法的主要挑战。目前由于其计算效率,对接和评分仍然是虚拟筛选中最流行的方法。然而,在评分函数中大量采用的经验参数和人工校对的数据限制了预测的准确性。另一方面,基于物理原理的计算方法对小分子体系有着很高的准确性,但由于时间成本太大而不能直接应用于处理体量巨大的蛋白质

配体体系的虚拟筛选。市场迫切需要一种兼顾药物筛选的速度和准确度的一种新算法。

技术实现思路

[0004]本专利技术的目的在于提供一种人工智能AI深度学习技术驱动的药物筛选算法,以解决上述
技术介绍
中提出的问题。
[0005]本专利技术是通过以下技术方案实现的:
[0006]一种人工智能AI深度学习技术驱动的药物筛选算法,引入基于物理原理的端到端深度学习模型Molecule CapsNet进行虚拟筛选;在此模型中,CapsNet作为网络架构,并将多体力场方程式用于表达原子间的相互作用力;在Molecule CapsNet中,基本的分子结构数据被输入网络,基本的分子结构数据包括原子坐标和原子类型,多体力场方程式用于分析出对预测配体结合力至关重要的特征值;然后将这些表达原子间相互作用的特征值分类为能量项;
[0007]Molecule CapsNet结合了数据驱动法和物理原理法的预测能力,从最简单的输入数据即原子坐标和原子类型中连续学习更高阶的物理特征,并把配体亲和热力学循环整合到神经网络优化中,直接预测亲和自由能;分子系统中每个体系即结合物,蛋白质和配体的自由能为其所有原子的能量之和,即其中n是原子总数,E
i
取决于每个特定原子的化学环境,而该化学环境是由以该原子为中心的截止半径球体内所有邻近原子的位置和类
型决定的;原子与其相邻原子之间的函数关系及其能量贡献是通过原子神经网络来构建的;Molecule CapsNet由n个平行的原子神经网络组成;通过这些单个原子能量E
i
,在蛋白质的亲和区域找到强相互作用点,并据此得出配体的亲和模式。
[0008]具体包括:
[0009]输入数据:Molecule CapsNet的基本数据集包括笛卡尔原子坐标矩阵C[n,3]和原子类型矢量A[n];用原子数来代表原子类型;这些基本数据集通过以下的预处理步骤得到输入数据:首先,为每个原子的邻居列表创建一个矩阵N[n,m];邻居列表中列出的是距离截止值为以内的m个最邻近的原子;利用矩阵N,为原子间距离和相邻原子的原子类型分别创建两个矩阵D[n,m]和T[n,m];D
i,j
定义为原子i与其邻近原子j之间的距离;T
i,j
是原子i的邻近原子j的原子类型,A
i

[0010]原子类型的卷积层:该层的输出DA[n,m,n
at
]由矩阵D和T而得;矩阵D被馈入具有步长1和深度为n
at
的(1
×
1)过滤器,其中n
at
是分子系统中的原子类型的数量;原子类型卷积核是一个对矩阵D运算的阶梯函数:
[0011][0012]其中a是过滤器的原子类型,a=1,

n
at

[0013]原子神经网络层:该层包含一组并行的原子神经网络;原子类型卷积层DA的大小为(n,m,n
at
);将矩阵逐行即对应于每个原子输入原子神经网络层;每个原子神经网络从DA接收一个大小为(1,m,n
at
)的薄片;
[0014]PrimaryCaps层由胶囊组成,原子i的原子间相互作用E
i
的特征参数在胶囊中被组织和学习;E
i
写成配对函数之和加上多体函数的形式,
[0015][0016]配对函数用多项式势能来近似,
[0017][0018]其中A
j
,B
j
和C
j
是可学习的参数;上述等式中的项分别类似于原子间库仑能,范德华吸引能和排斥能;多体函数根据原子i的距离截止半径内所有原子的位置,通过构造多体对称函数f
s
来获得:
[0019]f
s
(D
i,j
)=exp(

η
j
(D
i,j

D
s,j
)2)f
c
(D
i,j
),
[0020][0021]PrimaryCaps层的过滤器具有的函数形式;对原子i在DA[1,m,n
at
]上运行步幅为1、深度为n
r
的过滤器(m
×
1),其中n
r
是所需过滤器的数量;上述函数中的参数D
s,j
和η
j
是可学习的参数;参数D
c
是径向相互作用截止距离,设置为这样,每个胶囊接收到一个值
[0022][0023]其中是不可学习的缩放常数,是不可学习的偏差常数;从概念上讲,应用这些过滤器就会得到原子i与原子类型为a的所有相邻原子之间的相互作用之和;
[0024]胶囊结构封装了的四个能量项,包括键合能,库仑能,范德华吸引能和排斥能;在PrimaryCaps层和FeatureCaps层之间采用标准的动态路由;应用约束条件以确保在FeatureCaps层实现四个能量项的分类,从而评估它们对总能量的贡献;最后,featureCaps层的输出被送入完全连接层,在该层所有的原子神经网络都使用相同的权重和偏差;原子神经网络的输出是原子i的能量E
i
;分子系统的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人工智能AI深度学习技术驱动的药物筛选算法,其特征在于:引入基于物理原理的端到端深度学习模型Molecule CapsNet进行虚拟筛选;在此模型中,CapsNet作为网络架构,并将多体力场方程式用于表达原子间的相互作用力;在Molecule CapsNet中,基本的分子结构数据被输入网络,基本的分子结构数据包括原子坐标和原子类型,多体力场方程式用于分析出对预测配体结合力至关重要的特征值;然后将这些表达原子间相互作用的特征值分类为能量项;Molecule CapsNet结合了数据驱动法和物理原理法的预测能力,从最简单的输入数据即原子坐标和原子类型中连续学习更高阶的物理特征,并把配体亲和热力学循环整合到神经网络优化中,直接预测亲和自由能;分子系统中每个体系即结合物,蛋白质和配体的自由能为其所有原子的能量之和,即其中n是原子总数,E
i
取决于每个特定原子的化学环境,而该化学环境是由以该原子为中心的截止半径球体内所有邻近原子的位置和类型决定的;原子与其相邻原子之间的函数关系及其能量贡献是通过原子神经网络来构建的;Molecule CapsNet由n个平行的原子神经网络组成;通过这些单个原子能量E
i
,在蛋白质的亲和区域找到强相互作用点,并据此得出配体的亲和模式。2.根据权利要求1所述的一种人工智能AI深度学习技术驱动的药物筛选算法,其特征在于:具体包括:输入数据:Molecule CapsNet的基本数据集包括笛卡尔原子坐标矩阵C[n,3]和原子类型矢量A[n];用原子数来代表原子类型;这些基本数据集通过以下的预处理步骤得到输入数据:首先,为每个原子的邻居列表创建一个矩阵N[n,m];邻居列表中列出的是距离截止值为以内的m个最邻近的原子;利用矩阵N,为原子间距离和相邻原子的原子类型分别创建两个矩阵D[n,m]和T[n,m];D
i,j
定义为原子i与其邻近原子j之间的距离;T
i,j
是原子i的邻近原子j的原子类型,A
i
;原子类型的卷积层:该层的输出DA[n,m,n
at
]由矩阵D和T而得;矩阵D被馈入具有步长1和深度为n
at
的(1
×
1)过滤器,其中n
at
是分子系统中的原子类型的数量;原子类型卷积核是一个对矩阵D运算的阶梯函数:其中a是过滤器的原子类型,a=1,

n
at
;原子神经网络层:该层包含一组并行的原子神经网络;原子类型卷积层DA的大小为(n,m,n
at
);将矩阵逐行即对应于每个原子输入原子神经网络层;每个原子神经网络从DA接收一个大小为(1,m,n
at

【专利技术属性】
技术研发人员:陈炜孙王燕
申请(专利权)人:南昌大学抚州医学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1