药物敏感预测模型的训练方法、预测方法及相关装置制造方法及图纸

技术编号:27940273 阅读:35 留言:0更新日期:2021-04-02 14:21
本申请提供了一种药物敏感预测模型的训练方法、预测方法及相关装置。通过从多个细胞系中抽样出第一设定个数的细胞系,作为训练细胞系,对每个训练细胞系集合,基于一种改进的bootstrap抽样方法生成多套训练数据集。对每套训练数据集执行重要特征筛选过程,得到重要特征集。统计代谢物特征在所有轮数的特征筛选过程中出现的次数,基于被选中次数对代谢物特征重要性从高到低进行排序,选择出设定个数的重要性高的代谢物特征,保证待使用的代谢物特征重要性更高且具有更高鲁棒性,提高其有效性。在此基础上,使用选择出的代谢物特征利用集成的方法对训练细胞系构建预测模型,然后对新的测试数据细胞系进行预测,能提高模型预测的准确性。

【技术实现步骤摘要】
药物敏感预测模型的训练方法、预测方法及相关装置
本申请涉及数据处理领域,特别涉及一种药物敏感预测模型的训练方法、预测方法及相关装置。
技术介绍
肿瘤是一类复杂的异质性疾病,如即使相同病理类型的肿瘤患者对抗肿瘤药物反应迥异。因此肿瘤科学成为了精准医疗的重要领域之一,精准用药能达到更好的治疗效果并减少副作用的产生。实施肿瘤精准医疗的途径之一是在动物体内移植肿瘤,然后把药物作用于动物体内,观察药物对动物体内肿瘤生长的影响而确定疗效。该方法费用高、耗时长而且成功率低。面对这些挑战,人类癌症细胞系为筛选治疗癌症的候选药物提供了新的载体。目前用细胞系培养技术培养出的癌症细胞系能够近似的模拟癌症细胞在癌症病人体内的生长环境,癌症细胞系和癌症病人体内癌症细胞的各组学水平具有极大的相似性。因此通过分析癌症细胞系分子数据预测药物反应,能够预测药物在病人体内的反应。但是,如何基于癌症细胞系分子数据预测药物反应,成为问题。
技术实现思路
为解决上述技术问题,本申请实施例提供一种药物敏感预测模型的训练方法、预测方法及相关装置,以达到提高待使用本文档来自技高网...

【技术保护点】
1.一种药物敏感预测模型的训练方法,其特征在于,包括:/n获取多个细胞系中每个所述细胞系的代谢物特征及每个所述细胞系的药物反应参数IC50;/n对每个所述细胞系,基于所述药物反应参数IC50,确定药物应答类别;/n对构建的每个癌症细胞系药物敏感预测模型,从多个所述细胞系中抽样出第一设定个数的细胞系,作为训练细胞系,对每个所述训练细胞系,执行多次重要特征筛选过程;/n每次所述重要特征筛选过程,包括:将所述训练细胞系的代谢物特征输入到所述癌症细胞系药物敏感预测模型,得到所述癌症细胞系药物敏感预测模型输出的重要特征集;/n对每个所述训练细胞系的每个代谢物特征,统计所述代谢物特征在每个所述癌症细胞系药...

【技术特征摘要】
1.一种药物敏感预测模型的训练方法,其特征在于,包括:
获取多个细胞系中每个所述细胞系的代谢物特征及每个所述细胞系的药物反应参数IC50;
对每个所述细胞系,基于所述药物反应参数IC50,确定药物应答类别;
对构建的每个癌症细胞系药物敏感预测模型,从多个所述细胞系中抽样出第一设定个数的细胞系,作为训练细胞系,对每个所述训练细胞系,执行多次重要特征筛选过程;
每次所述重要特征筛选过程,包括:将所述训练细胞系的代谢物特征输入到所述癌症细胞系药物敏感预测模型,得到所述癌症细胞系药物敏感预测模型输出的重要特征集;
对每个所述训练细胞系的每个代谢物特征,统计所述代谢物特征在每个所述癌症细胞系药物敏感预测模型多次输出的重要特征集中出现的次数,作为被选中次数;
对每个所述训练细胞系的每个所述代谢物特征,将所述代谢物特征的多个所述被选中次数中的最大值作为目标次数;
对多个所述目标次数进行从大到小排序,得到目标排序结果,将所述目标排序结果中第一个至第m个目标次数对应的代谢物特征,作为待使用代谢物特征;
利用所述待使用代谢物特征,及所述待使用代谢物特征所属细胞系的药物应答类别对待训练癌症细胞系药物敏感预测模型进行训练。


2.根据权利要求1所述的方法,其特征在于,所述将所述训练细胞系的代谢物特征输入到所述癌症细胞系药物敏感预测模型,得到所述癌症细胞系药物敏感预测模型输出的重要特征集,包括:
利用归一化关系式(x-min_x)/(max_x-min_x),将所述训练细胞系的每个代谢物特征进行归一化,得到归一化后的代谢物特征;
所述x表示所述代谢物特征在所述细胞系中的含量,min_x为所述代谢物特征在多个所述细胞系中的含量的最小值,max_x为所述代谢物特征在多个所述细胞系中的含量的最大值;
将所述训练细胞系的归一化后的代谢物特征输入到所述癌症细胞系药物敏感预测模型,得到所述癌症细胞系药物敏感预测模型输出的重要特征集。


3.根据权利要求1所述的方法,其特征在于,所述利用所述待使用代谢物特征,及所述待使用代谢物特征的药物应答类别对待训练癌症细胞系药物敏感预测模型进行训练,之后:
从多个所述细胞系中抽样出第二设定个数的细胞系,作为测试细胞系,分别利用所述待训练癌症细胞系药物敏感预测模型对各个所述测试细胞系的每个代谢物特征进行多次预测,得到预测结果;
对各个所述预测结果进行评估,得到评估结果;
基于多个所述评估结果,判断所述待训练癌症细胞系药物敏感预测模型是否满足设定要求;
若满足,结束训练;
若不满足,则返回执行所述获取多个细胞系中每个所述细胞系的代谢物特征及每个所述细胞系的药物反应参数IC50的步骤。


4.根据权利要求3所述的方法,其特征在于,所述对各个所述预测结果进行评估,得到评估结果之前,还包括:
基于每个所述测试细胞系中每个所述代谢物特征的多个所述预测结果,判断多个所述训练细胞系中是否存在异常细胞系;
若存在,则剔除多个所述训练细胞系中的异常细胞系,将剔除所述异常细胞系后的细胞系作为训练细胞系,并返回执行所述对每个所述训练细胞系,执行多次重要特征筛选过程的步骤;
若不存在,则对各个所述预测结果进行评估,得到评估结果;
基于所述评估结果,判断所述待训练癌症细胞系药物敏感预测模型是否满足设定要求;
若满足,结束训练;
若不满足,则返回执行所述获取多个细胞系中每个所述细胞系的代谢物特征及每个所述细胞系的药物反应参数IC50的步骤。


5.根据权利要求1所述的方法,其特征在于,所述基于所述药物反应参数IC50,确定药物应答类别,包括:
将多个所述细胞系中所述药物反应参数IC50相同的细胞系划分为一组,得到细胞系组,并统计每个所述细胞系组中细胞系的个数;
在多个所述细胞系组的药物反应参数IC50中查找目标药物反应参数IC50,其中,小于所述目标药物反应参数IC50的药物反应参数IC50所属细胞系组中细胞系的个数之和,与大于所述目标药物反应参数IC50的药物反应参数IC50所属细胞系组中细胞系的个数之和的差值在设定阈值范围内;
将所述目标药物反应参数IC50作为预设药物反应参数IC50阈值;
判断所述药物反应参数IC50是否大于预设药物反应参数IC50阈值;
若是,则确定药物应答类别为不敏感;
若否,则确定药物应答类别为敏感。


6.一种药物敏感预测方法,其特征在于,包括:
获取待处理细胞系的代谢物特征;
调用癌症细胞系药物敏感预测模型,对所述待处理细胞系的代谢物特征进行处理,以获得药物应答类别;

【专利技术属性】
技术研发人员:王爱兰倪海洪翟晓庆
申请(专利权)人:北京深度制耀科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1