合成致死基因对预测模型的训练方法、装置和电子设备制造方法及图纸

技术编号:38027768 阅读:6 留言:0更新日期:2023-06-30 10:54
本发明专利技术公开了合成致死基因对预测模型的训练方法、装置和电子设备,属于生物医疗信息技术领域。训练方法包括:获取训练数据,包括选自人类全部编码基因的合成致死基因对和非合成致死基因对,以及所述人类全部编码基因对应的基因细胞系敲除效应指数谱;利用训练数据训练深度学习模型,以输出合成致死基因对,得到合成致死基因对预测模型。实现了对人类全部编码基因合成致死对的预测。因此,采用本发明专利技术提供的技术方案可以减少不必要的临床实验,从而减少了临床前的资金与时间投入。而且,利用预测得到的合成致死基因对可以筛选出潜在的合成致死靶标,还可以基于不同细胞系中的预测结果拓展验证潜在的适应症,提高了临床实验的成功率。功率。功率。

【技术实现步骤摘要】
合成致死基因对预测模型的训练方法、装置和电子设备


[0001]本专利技术涉及生物医疗信息
,尤其涉及一种合成致死基因对预测模型的训练方法、装置和电子设备。

技术介绍

[0002]如果两个基因的活性缺失导致细胞缺陷而无法生存,而任一基因的活性缺失都对细胞存活无害,则两个基因被认为是合成致死对。许多癌细胞在合成致死对的一个基因中携带特定突变,导致该基因失去活性,因此其合成致死伴侣有希望成为药物的靶点。例如,肿瘤抑制基因BRCA1/2和药物靶基因PARP1之间已知的合成致死相互作用可用于通过触发致命的DNA损伤来选择性地杀死癌细胞。目前,PARP1抑制剂已被批准用于治疗某些类型的BRCA突变癌症。人类约有2万蛋白编码基因,相应理论上的约有2亿(20,000*20,000/2)基因对等待研究。然而,目前仅有少数几对合成致基因死对在特定细胞系中被验证。因此,通过生物实验的方法在各不同细胞系中寻找验证2亿基因对是否合成致死几乎是无法完成的任务。
[0003]随着机器学习尤其是深度学习技术的发展,越来越多的科学规律可以通过深度学习的方法获得。药理学前沿杂志(Frontiers in Pharmacology)上发表的文章“EXP2SL:一种预测细胞系特异性的合成致死对的深度学习框架”中,作者开发了一种深度学习方法,使用基因敲除差异表达谱预测合成致死对。但是该方法受限于基因敲除差异表达谱对应的细胞系种类和基因数量,只能在3个细胞系中对大约4000个基因进行预测,即只能在3个细胞系中预测800万基因对是否合成致死(4000*4000/2)。

技术实现思路

[0004]为了解决现有技术中存在的问题,本专利技术提供了如下技术方案。
[0005]本专利技术第一方面提供了一种合成致死基因对预测模型的训练方法,包括:获取训练数据,所述训练数据包括选自人类全部编码基因的合成致死基因对和非合成致死基因对,以及所述人类全部编码基因分别对应的基因细胞系敲除效应指数谱;利用所述训练数据训练深度学习模型,以输出合成致死基因对,得到合成致死基因对预测模型。
[0006]优选地,所述利用所述训练数据训练深度学习模型包括:获取基因细胞系敲除效应指数谱的向量;将任意两个基因细胞系敲除效应指数谱的向量相加,得到表征向量A;将任意两个基因细胞系敲除效应指数谱的向量相减,得到表征向量B;将表征向量A和表征向量B作为输入,将与所述任意两个基因细胞系敲除效应指数谱对应的所述合成致死基因对或非合成致死基因对作为标签,训练所述深度学习模型。
[0007]优选地,以二分类交叉熵损失作为目标优化函数,使用Adam优化器作为下降方法训练所述深度学习模型。
[0008]优选地,所述深度学习模型采用四层全连接神经网络。
[0009]优选地,所述方法还包括按照如下方式获取所述基因细胞系敲除效应指数谱:获取基因细胞系敲除效应指数数据;使用平均值填充法取代所述基因细胞系敲除效应指数数据中的缺失值,得到基因细胞系敲除效应指数谱。
[0010]优选地,所述方法还包括:若所述训练数据中的所述合成致死基因对中至少有一个基因没有细胞系敲除效应指数谱,则将对应的合成致死基因对删除;若所述训练数据中的非合成致死基因对中至少有一个基因没有细胞系敲除效应指数谱,则将对应的非合成致死基因对删除。
[0011]本专利技术第二方面提供了一种合成致死基因对预测模型的训练装置,包括:训练数据获取模块,用于获取训练数据,所述训练数据包括选自人类全部编码基因的合成致死基因对和非合成致死基因对,以及所述人类全部编码基因对应的基因细胞系敲除效应指数谱;模型训练模块,用于利用所述训练数据训练深度学习模型,以输出合成致死基因对,得到合成致死基因对预测模型。
[0012]本专利技术第三方面提供了一种合成致死基因对预测方法,包括:利用合成致死基因对预测模型在不同细胞系中预测合成致死基因对;所述合成致死基因对预测模型为预先利用如第一方面所述的方法训练得到的。
[0013]本专利技术第四方面提供了一种存储器,其特征在于,存储有多条指令,所述指令用于实现如第一方面所述的合成致死基因对预测模型的训练方法,或如第三方面所述的合成致死基因对预测方法。
[0014]本专利技术第五方面提供了一种电子设备,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如第一方面所述的合成致死基因对预测模型的训练方法,或如第三方面所述的合成致死基因对预测方法。
[0015]本专利技术的有益效果是:本专利技术提供的一种合成致死基因对预测模型的训练方法、装置和电子设备,通过利用人类全部编码基因的细胞系敲除效应指数谱作为训练数据训练深度学习模型,得到合成致死基因对预测模型,并利用得到的合成致死基因对预测模型在各不同细胞系中预测合成致死基因对,实现了对人类全部编码基因合成致死对的预测。因此,采用本专利技术提供的技术方案可以减少不必要的临床实验,从而减少了临床前开发的资金与时间投入。而且,利用预测得到的合成致死基因对可以筛选出潜在的合成致死靶标,提高了临床实验的成功率。同时对于已开发和正在开发的合成致死基因对,可基于不同细胞系中的预测结果拓展验证潜在的适应症,减少不必要的临床试验,提高临床实验的成功率。
附图说明
[0016]图1为本专利技术所述合成致死基因对预测模型的训练方法流程示意图;图2为本专利技术所述合成致死基因对预测模型的训练装置的功能结构示意图。
具体实施方式
[0017]为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
[0018]本专利技术提供的方法可以在如下的终端环境中实施,该终端可以包括一个或多个如下部件:处理器、存储器和显示屏。其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现下述实施例所述的方法。
[0019]处理器可以包括一个或者多个处理核心。处理器利用各种接口和线路连接整个终端内的各个部分,通过运行或执行存储在存储器内的指令、程序、代码集或指令集,以及调用存储在存储器内的数据,执行终端的各种功能和处理数据。
[0020]存储器可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read

Only Memory,ROM)。存储器可用于存储指令、程序、代码、代码集或指令。
[0021]显示屏用于显示各个应用程序的用户界面。
[0022]除此之外,本领域技术人员可以理解,上述终端的结构并不构成对终端的限定,终端可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端中还包括射频电路、输入单元、传感器、音频电路、电源等部件,在此不再赘述。
[0023]实施例一如图1所示,本专利技术实施例提供了一种合成致死基因对预测模型的训练方法,包括:S101,获取训练数据,所述训练数据包括选自人类全部编码基因的合成致死基因对和非合成致死基因对,以及所述人类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合成致死基因对预测模型的训练方法,其特征在于,包括:获取训练数据,所述训练数据包括选自人类全部编码基因的合成致死基因对和非合成致死基因对,以及所述人类全部编码基因对应的基因细胞系敲除效应指数谱;利用所述训练数据训练深度学习模型,以输出合成致死基因对,得到合成致死基因对预测模型。2.如权利要求1所述的合成致死基因对预测模型的训练方法,其特征在于,所述利用所述训练数据训练深度学习模型包括:获取基因细胞系敲除效应指数谱的向量;将任意两个基因细胞系敲除效应指数谱的向量相加,得到表征向量A;将任意两个基因细胞系敲除效应指数谱的向量相减,得到表征向量B;将表征向量A和表征向量B作为输入,将与所述任意两个基因细胞系敲除效应指数谱对应的所述合成致死基因对或非合成致死基因对作为标签,训练所述深度学习模型。3.如权利要求2所述的合成致死基因对预测模型的训练方法,其特征在于,以二分类交叉熵损失作为目标优化函数,使用Adam优化器作为下降方法训练所述深度学习模型。4.如权利要求2所述的合成致死基因对预测模型的训练方法,其特征在于,所述深度学习模型采用四层全连接神经网络。5.如权利要求1所述的合成致死基因对预测模型的训练方法,其特征在于,所述方法还包括按照如下方式获取所述基因细胞系敲除效应指数谱:获取基因细胞系敲除效应指数数据;使用平均值填充法取代所述基因细胞系敲除效应指数数据中的缺失值,得到基因细胞系敲除效应指数谱。6.如权利要求1所述的合成致死基因对预测模型的训练方法,其特征在于,所述方法还包...

【专利技术属性】
技术研发人员:季序我彭鑫鑫余丹阳李哲
申请(专利权)人:普瑞基准科技北京有限公司北京普康瑞仁医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1