用于预测药物敏感状态的方法、设备和存储介质技术

技术编号:28380145 阅读:20 留言:0更新日期:2021-05-08 00:08
本公开涉及一种用于预测药物敏感状态的方法、计算设备和存储介质。该方法包括:获取待测样本的基因变异信息和有关药物的药物信息;获取关于细胞与对应药物的细胞活性试验而确定的药物敏感状态数据;针对基因变异信息、药物信息进行预处理,以便生成多种基因变异表征数据和多种药物表征数据,以用于组合成多组输入样本集;基于第一神经网络模型生成基因变异特征;基于第二神经网络模型生成药物特征;基于第三神经网络模型,提取经融合的基因变异特征和药物特征的特征,以用于预测待测样本针对对应药物的药物敏感状态。本公开能够准确预测药物敏感性并具有较好的泛用性。

【技术实现步骤摘要】
用于预测药物敏感状态的方法、设备和存储介质
本公开总体上涉及生物信息处理,并且具体地,涉及用于预测药物敏感状态的方法、设备和存储介质。
技术介绍
随着分子生物学和测序技术的发展以及肿瘤发生分子机制的深入研究,肿瘤的精准治疗展现了广阔的应用前景。然而,肿瘤细胞自身异质性通常会导致药物响应不稳定,这种药物响应不稳定给肿瘤药物研发领域一个重大挑战。传统的用于预测药物敏感状态的方案例如是利用药物代谢相关的基因位点组合(DPYD*2A、DPYD*5A、DPYD*9A、MTHFR、TS和GSTP1)突变情况检测,对拟采用氟尿嘧啶类药物治疗的病人进行药物敏感指导。上述传统的用于预测药物敏感状态的方案大多集中于单一类型药物对于少数基因的耐药性IC50值的预测,所采用的模型的泛用性不够理想,同时由于没有考虑到药物和基因不同表达对于模型精度的影响,因此使得所预测的药物敏感性的精度不高。综上,传统的用于预测药物敏感状态的方案存在泛用性不够理想,并且所预测的药物敏感性的精度不高的不足之处。
技术实现思路
本公开提供一种用于预测药物敏感状态的方法、计算设备和计算机存储介质,能够准确预测药物敏感性并具有较好的泛用性。根据本公开的第一方面,提供了一种预测药物敏感状态的方法。该方法包括:获取待测样本的基因变异信息和有关药物的药物信息,药物信息至少包括药物标识以及药物分子式结构信息;获取关于细胞与对应药物的细胞活性试验而确定的药物敏感状态数据;针对基因变异信息、药物信息进行预处理,以便生成多种基因变异表征数据和多种药物表征数据,以用于组合成多组输入样本集;基于第一神经网络模型,提取输入样本集中的基因变异表征数据的特征,以便生成基因变异特征;基于第二神经网络模型,提取输入样本集中的药物表征数据的特征,以便生成药物特征;融合基因变异特征和药物特征;以及基于第三神经网络模型,提取经融合的基因变异特征和药物特征的特征,以用于预测待测样本针对对应药物的药物敏感状态,第一神经网络模型、第二神经网络模型和第三神经网络模型是经由多样本训练的。根据本专利技术的第二方面,还提供了一种计算设备,该设备包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令当由至少一个处理单元执行时,使得计算设备执行本公开的第一方面的方法。根据本公开的第三方面,还提供了一种计算机可读存储介质。该计算机可读存储介质上存储有机器可执行指令,该机器可执行指令在被执行时使机器执行本公开的第一方面的方法。在一些实施例中,所述待测样本为细胞系或者原代细胞,所述药物敏感状态数据是经由关于细胞系与对应药物的细胞活性试验而确定的。在一些实施例中,生成多种基因变异表征数据和多种药物表征数据以用于组合成多组输入样本集包括:基于经预处理的基因变异信息,分别生成一维基因变异表征特征和二维基因变异表征特征,一维基因变异表征特征指示细胞系标识信息、基因标识信息和变异影响类型信息,二维基因变异表征特征指示细胞系标识信息和细胞系的微卫星不稳定状态信息;以及基于二维基因变异表征特征和对应的二维权重数据,生成第三基因变异表征特征。在一些实施例中,生成多种基因变异表征数据和多种药物表征数据以用于组合成多组输入样本集:基于经预处理的药物信息,生成简化分子线性输入规范格式的药物表征数据、化学指纹格式的药物表征数据和邻接矩阵结构图格式的药物表征数据;以及分别将一维基因变异表征特征、二维基因变异表征特征和第三基因变异表征特征中的一种基因变异表征特征与简化分子线性输入规范格式的药物表征数据、化学指纹格式的药物表征数据和邻接矩阵结构图格式的药物表征数据中的一种药物表征数据进行组合,以便生成多组输入样本集,每一组输入样本集包括一种基因变异表征特征和一种药物表征数据。在一些实施例中,针对基因变异信息、药物信息进行预处理还包括:在所获取的细胞系的基因变异信息中选取与属于预定集合的基因相关联的基因变异信息;针对所选取的基因变异信息进行注释,以便生成变异影响类型信息;以及基于所选定的关于细胞系与对应药物的细胞活性试验而确定的药物敏感状态数据,去除符合以下至少一项的基因变异信息和药物信息:所获取的药物敏感状态数据为不稳定的细胞系与对应药物;以及对应药物缺失药物分子式结构信息。在一些实施例中,变异影响类型信息包括:关于基因激活、基因失活、基因重排、具有潜在临床意义、临床意义不明和耐药的信息,微卫星不稳定状态信息包括:关于微卫星稳定、微卫星低度不稳定、微卫星高度不稳定和微卫星稳定性不确定的信息。在一些实施例中,一维基因变异表征特征的特征值个数等于基因数量乘以基因突变状态数量并且加上细胞系的微卫星不稳定状态数量,二维基因变异表征特征的行指示细胞系的对应基因,二维基因变异表征特征的列指示变异影响类型信息或微卫星不稳定状态信息。在一些实施例中,用于预测药物敏感状态的方法还包括:确定述第一神经网络模型和第二神经网络模型,以便第一神经网络模型与输入样本集中的基因变异表征数据的种类相匹配,以及第二神经网络模型与输入样本集中的药物表征数据相匹配。在一些实施例中,用于预测药物敏感状态的方法包括:将每一组输入样本集分成训练数据集、验证数据集合测试数据集;以及针对每一组输入样本集,基于均方根误差来确定经由训练数据集所训练得到的第一神经网络模型、第二神经网络模型和第三神经网络模型在验证数据集合的拟合情况,以用于确定应用于测试数据集的第一神经网络模型、第二神经网络模型和第三神经网络模型。提供
技术实现思路
部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。附图说明图1示出了根据本公开的实施例的用于预测药物敏感状态的方法的系统的示意图。图2示出了根据本公开的实施例的用于预测药物敏感状态的方法的流程图。图3示出了根据本公开的实施例的用于预测药物敏感状态的神经网络结构的示意图。图4示意性示出了某个药物的3D结构的示意图。图5示出了根据本公开的实施例的用于组合成多组输入样本集的方法的流程图。图6示出了根据本公开的实施例的用于基因变异信息和药物信息的数据预处理方法的流程图。图7示意性示出了适于用来实现本公开实施例的电子设备的框图。在各个附图中,相同或对应的标号表示相同或对应的部分。具体实施方式下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个本文档来自技高网
...

【技术保护点】
1.一种用于预测药物敏感状态的方法,包括:/n获取待测样本的基因变异信息和有关药物的药物信息,所述药物信息至少包括药物标识以及药物分子式结构信息;/n获取关于细胞与对应药物的细胞活性试验而确定的药物敏感状态数据;/n针对所述基因变异信息、药物信息进行预处理,以便生成多种基因变异表征数据和多种药物表征数据,以用于组合成多组输入样本集;/n基于第一神经网络模型,提取输入样本集中的基因变异表征数据的特征,以便生成基因变异特征;/n基于第二神经网络模型,提取输入样本集中的药物表征数据的特征,以便生成药物特征;/n融合所述基因变异特征和所述药物特征;以及/n基于第三神经网络模型,提取经融合的所述基因变异特征和所述药物特征的特征,以用于预测待测样本针对对应药物的药物敏感状态,所述第一神经网络模型、第二神经网络模型和第三神经网络模型是经由多样本训练的。/n

【技术特征摘要】
1.一种用于预测药物敏感状态的方法,包括:
获取待测样本的基因变异信息和有关药物的药物信息,所述药物信息至少包括药物标识以及药物分子式结构信息;
获取关于细胞与对应药物的细胞活性试验而确定的药物敏感状态数据;
针对所述基因变异信息、药物信息进行预处理,以便生成多种基因变异表征数据和多种药物表征数据,以用于组合成多组输入样本集;
基于第一神经网络模型,提取输入样本集中的基因变异表征数据的特征,以便生成基因变异特征;
基于第二神经网络模型,提取输入样本集中的药物表征数据的特征,以便生成药物特征;
融合所述基因变异特征和所述药物特征;以及
基于第三神经网络模型,提取经融合的所述基因变异特征和所述药物特征的特征,以用于预测待测样本针对对应药物的药物敏感状态,所述第一神经网络模型、第二神经网络模型和第三神经网络模型是经由多样本训练的。


2.根据权利要求1所述的方法,其中所述待测样本为细胞系或者原代细胞,所述药物敏感状态数据是经由关于细胞系与对应药物的细胞活性试验而确定的。


3.根据权利要求2所述的方法,其中生成多种基因变异表征数据和多种药物表征数据以用于组合成多组输入样本集包括:
基于经预处理的所述基因变异信息,分别生成一维基因变异表征特征和二维基因变异表征特征,所述一维基因变异表征特征指示细胞系标识信息、基因标识信息和变异影响类型信息,所述二维基因变异表征特征指示细胞系标识信息和细胞系的微卫星不稳定状态信息;以及
基于所述二维基因变异表征特征和对应的二维权重数据,生成第三基因变异表征特征。


4.根据权利要求3所述的方法,其中生成多种基因变异表征数据和多种药物表征数据以用于组合成多组输入样本集:
基于经预处理的所述药物信息,生成简化分子线性输入规范格式的药物表征数据、化学指纹格式的药物表征数据和邻接矩阵结构图格式的药物表征数据;以及
分别将一维基因变异表征特征、二维基因变异表征特征和第三基因变异表征特征中的一种基因变异表征特征与简化分子线性输入规范格式的药物表征数据、化学指纹格式的药物表征数据和邻接矩阵结构图格式的药物表征数据中的一种药物表征数据进行组合,以便生成多组输入样本集,每一组输入样本集包括一种基因变异表征特征和一种药物表征数据。
...

【专利技术属性】
技术研发人员:王凯罗培韬俞燕飞
申请(专利权)人:至本医疗科技上海有限公司上海至本医学检验所有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1