当前位置: 首页 > 专利查询>汕头大学专利>正文

一种基于小样本的药物抑制能力预测方法技术

技术编号:38572512 阅读:11 留言:0更新日期:2023-08-22 21:06
本发明专利技术实施例公开了一种基于小样本的药物抑制能力预测方法,将原始的特征向量经过一个注意力矩阵之后得到维度更小、更具有代表性的特征向量,再将得到的特征向量进行两两拼接,按照原始标签的大小定义新标签为0或者1。再将拼接后的特征向量通过一个由卷积层和全连接层组成的分类器模型,将需要检测抑制效力的化合物分子的特征向量和表中其他已知抑制效力值的化合物分子的特征向量一起放入训练好的模型中,通过对比预测预测结果,得出相对大小,再通过查表,得出待检测的化合物的抑制效力值的范围。本发明专利技术获得抑制效力值的范围比直接通过回归的方式预测抑制效力的精确值更简单,而且需要的样本数量更少。而且需要的样本数量更少。而且需要的样本数量更少。

【技术实现步骤摘要】
一种基于小样本的药物抑制能力预测方法


[0001]本专利技术涉及使用计算辅助药物研究
,尤其涉及一种基于小样本的药物抑制能力预测方法。

技术介绍

[0002]肿瘤细胞的代谢与正常细胞有显著差异。即使在有氧条件下,它们也依靠糖酵解来提供三磷酸腺苷(ATP),从而完成分裂、增殖和入侵的过程。因此,糖酵解途径中的重要辅酶烟酰胺腺嘌呤二核苷酸(NAD+)在肿瘤细胞中的消耗显著增加。肿瘤细胞中的NAD主要来源于主要的挽救途径。烟酰胺磷酸核糖转移酶(NAMPT)作为NAD挽救合成途径中的限速酶,被发现在癌细胞中上调,增加肿瘤细胞中NAD+的水平,促进细胞生物学过程如糖酵解过程。它还可以通过影响NAD依赖酶的活性和上调,间接促进还原谷胱甘肽(GSH)与活性氧(ROS)的结合从而使肿瘤细胞能够适应相对缺乏能量的环境,并增强其抵抗力到不利环境。因此,NAMPT作为一个潜力抗肿瘤治疗靶点和NAMPT抑制剂可能提供治疗癌症的绝好机会。
[0003]尽管生物技术和对生物系统的理解已经取得了进步,但药物设计仍然是一个漫长、昂贵、困难和低效的过程。药物发现过程中最费力的一项工作是从库中选择化合物进行实验评价。计算机辅助药物设计在加速潜在先导化合物的发现和优化其结构方面发挥着至关重要的作用。在计算机辅助药物设计中,机器学习被广泛用于训练模型来预测目标特性,包括它们的效力和毒性:比如使用支持向量机结合药效团建模来区分化合物活性;使用随机森林与开源数据结合预测相关酶的活性;使用贝叶斯算法处理和组织庞大的分子数据集,利用贝叶斯分类器进行突变型预测。各种深度学习方法也通过通用学习过程来发现化合物数据中的隐式关系:比如使用深度卷积神经网络来预测分子的化学性质;利用多任务自编码器深度神经网络对细胞色素的抑制效力进行预测;利用深度学习方法和随机森林计算预测的生物活性;通过训练两层神经网络,利用结构特征、物理化学性质和残留物接触预测模型质量。
[0004]利用机器学习或者深度学习进行分类或者回归,往往需要大量的数据才能获得较好的结果,对于药物预测同样如此。由于化合物分子通常具有几千种的分子特性对应几千个维度的特征空间,目标抑制效力可能只与少数特征有关系,过大的特征空间会导致模型训练过程中抓不住重点、训练时间过长;不同机构或使用实验测定的实验数据有时差异很大无法集中起来凑成一个大样本对分子特性进行预测,因此用于预测特定分子抑制效力实验的数据集样本数目通常很少;由于测量的工具以及化合物分子所处的生物细胞环境的差异,用于训练的数据集可能会有误差。因此小样本、较高的特征空间维度、以及测量时的系统误差导致了利用机器学习或者深度学习进行药物预测的结果往往准确率很低。对于用回归的方法进行对药物抑制效力进行准确值预测的实验都具有无法分辨出具有相似抑制效力的化合物的缺陷。

技术实现思路

[0005]本专利技术实施例所要解决的技术问题在于,提供一种基于小样本的药物抑制能力预测方法,可利用机器学习或者深度学习的方法进行回归预测存在样本量少,特征维度大,以及回归模型不重视化合物之间的联系的问题。
[0006]为了解决上述技术问题,本专利技术实施例提供了一种基于小样本的药物抑制能力预测方法,包括以下步骤:
[0007]S1:将小规模抑制效力数据集中的特征向量集合ω经过一个参数矩阵进行降维重构为特征向量集合ω


[0008]S2:将S1得到的特征向量集合ω

进行扩充为特征向量集合ω

,同时对所述小规模抑制效力数据集中的标签集合ι也进行扩充为数据标签ι


[0009]S3:将扩充后的特征向量集合ω

和数据标签ι

放入一个由三层感知机组成的分类器,利用交叉熵损失函数对分类器进行有监督的二分类训练;
[0010]S4:使用小批量梯度下降方法对三层感知机的公式进行优化;
[0011]S5:将N个已知抑制效力值的化合物分子以及其特征向量建立表格,将需要检测抑制效力的化合物分子的特征向量和表中其他已知抑制效力值的化合物分子的特征向量一起放入训练好的模型中,通过对比预测预测结果,得出待检测的化合物分子和其他已知抑制效力的化合物分子的抑制效力的相对大小,再通过查表,可以知道待检测的化合物的抑制效力值的范围。
[0012]其中,所述S1的降维重构的方法包括以下步骤:
[0013]特征空间重新构建为
[0014][0015]将原始数据集的特征空间维度从Δ维转变为ε1维,ε1<Δ;
[0016]其中代表Δ
×
ε1大小的注意力矩阵,ω

代表经过特征空间转换之后的新的特征空间,表示重构后的特征空间有ε个样本,每个样本由长度为ε1的向量组成,向量中的每个元素都是实数。
[0017]所述S2的对特征向量集合ω

进行扩充的步骤包括:
[0018]特征向量集扩充为特征向量集扩充为
[0019]数据标签扩充为
[0020][0021][0022]对于特征向量的处理使用concat操作:concat代表拼接操作,该操作将特征向量集合中的每个元素进行两两拼接形成新的特征向量;对于标签的处理是通过比较两个元素的标签值的大小:当标签集合中第τ个元素的值小于等于第χ个元素的值的时候,新的标签
的值为0,否则为1;
[0023]ω
τ

代表ω

中的第τ个元素,ω
χ

代表ω

中的第χ个元素,ι
τ
代表ι中第τ个元素,ι
χ
代表ι中第χ个元素,T代表矩阵的转置,表示后的特征空间集合有(ε
×


1))个元素,每个元素是长度为(2
×
(ε1))的向量,向量中的每个元素都是实数,表示扩充后的标签集合有(ε
×


1))个元素,每个元素都是实数。
[0024]其中,所述S3中三层感知机的公式为:
[0025][0026]交叉熵损失函数为
[0027][0028]将特征向量通过三层感知机得到预测的标签值,然后再将预测的标签值和真实标签值通过交叉熵损失函数计算损失,得到模型的预测损失值;
[0029]其中,Φ代表分类器的训练公式,ω
τχ

代表ω

中的第τχ个元素,softmax和sigmoid代表深度学习里面的激活函数,π
(1)
代表第一层感知机的权重参数,ξ
(1)
代表第一层感知机的偏置参数,π
(2)
代表第二层感知机的权重参数,ξ
(2)
代表第二层感知机的偏置参数,π
(3)
代表第三层感知机的权重参数,ξ
(3)
代表第三层感知机的偏置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于小样本的药物抑制能力预测方法,其特征在于,包括以下步骤:S1:将小规模抑制效力数据集中的特征向量集合ω经过一个参数矩阵进行降维重构为特征向量集合ω

;S2:将S1得到的特征向量集合ω

进行扩充为特征向量集合ω

,同时对所述小规模抑制效力数据集中的标签集合ι也进行扩充为数据标签ι

;S3:将扩充后的特征向量集合ω

和数据标签ι

放入一个由三层感知机组成的分类器,利用交叉熵损失函数对分类器进行有监督的二分类训练;S4:使用小批量梯度下降方法对三层感知机的公式进行优化;S5:将N个已知抑制效力值的化合物分子以及其特征向量建立表格,将需要检测抑制效力的化合物分子的特征向量和表中其他已知抑制效力值的化合物分子的特征向量一起放入训练好的模型中,通过对比预测预测结果,得出待检测的化合物分子和其他已知抑制效力的化合物分子的抑制效力的相对大小,再通过查表,得出待检测的化合物的抑制效力值的范围。2.根据权利要求1所述的基于小样本的药物抑制能力预测方法,其特征在于,所述S1的降维重构的方法包括以下步骤:特征空间重新构建为特征空间重新构建为将原始数据集的特征空间维度从Δ维转变为ε1维,ε1<Δ;其中代表Δ
×
ε1大小的注意力矩阵,ω

代表经过特征空间转换之后的新的特征空间,表示重构后的特征空间有ε个样本,每个样本由长度为ε1的向量组成,向量中的每个元素都是实数。3.根据权利要求1所述的基于小样本的药物抑制能力预测方法,其特征在于,所述S2的对特征向量集合ω

进行扩充的步骤包括:特征向量集扩充为特征向量集扩充为数据标签扩充为ω
τχ

=concat(ω
τ


χ

);对于特征向量的处理使用concat操作:concat代表拼接操作,该操作将特征向量集合中的每个元素进行两两拼接形成新的特征向量;对于标签的处理是通过比较两个元素的标签值的大小:当标签集合中第τ个元素的值小于等于第χ个元素的值的时候,新的标签ι
τχ
的值为0,否则为1;ω
τ

代表ω

中的第τ个元素,ω
χ

代表ω

中的第χ个元素,ι
τ
代表ι中第τ个元素,ι
χ
代表ι中第χ个元素,T代表矩阵的转置,表示后...

【专利技术属性】
技术研发人员:周腾杨丽莎李泽权
申请(专利权)人:汕头大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1