System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型训练方法、反复种植失败识别方法及装置制造方法及图纸_技高网

模型训练方法、反复种植失败识别方法及装置制造方法及图纸

技术编号:41011677 阅读:5 留言:0更新日期:2024-04-18 21:48
本申请涉及一种模型训练方法、反复种植失败识别方法、装置、计算机设备、存储介质和计算机程序产品。通过获取样本数据,分别对第一测序数据样本和第二测序数据样本进行分析处理,得到对应的目标miRNA的表达量,基于第二测序数据样本中目标miRNA的表达量进行特征筛选,确定miRNA特征集合,根据第一测序数据样本和第二测序数据样本,确定与miRNA特征集合对应的第一表达量集合和第二表达量集合,采用第一表达量集合和第二表达量集合训练预测模型,直到预测模型收敛,得到目标预测模型。由于样本数据是正样本和负样本的测序数据,相较于传统的通过活检提取子宫内膜组织进行评估的方式,可以实现无创的样本提取,通过机器学习方法训练能够提高模型预测的准确性。

【技术实现步骤摘要】

本申请涉及生物信息,特别是涉及一种模型训练方法、反复种植失败识别方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、随着科学技术的进步,体外受精-胚胎移植(in-vitro fertilization-embryotransfer,简称ivf-et)已成为不孕女性尽快获得妊娠的有效途径。虽然胚胎移植技术已经得到巨大的发展,临床上仍有将近10%左右的患者在经历至少三次胚胎移植周期后,依旧无法成功妊娠,这部分患者被称为反复种植失败患者(recurrentimplantation failure,简称rif,指40岁以下的女性至少经历过3轮优质胚胎的移植后,仍未能实现临床妊娠),而植入失败的原因可能是胚胎或母体的子宫因素。可见,ivf患者成功移植胚胎的关键,除了需要正常发育的胚胎,还需要合适的子宫内膜状态。

2、传统技术中,通过植入前基因检测(preimplantation genetic testing,简称pgt)可以保证rif患者对整倍体胚胎进行移植,来进一步提高体外受精的成功率。但是由于患者自身的原因导致反复种植失败的情况依旧无法有效解决。如果可以在胚胎移植前通过评估母体状态来预测患者自身是否属于rif人群,不仅可以通过针对性治疗改善妊娠结局,还可以避免优质胚胎被浪费。

3、然而,传统的通过使用子宫内膜组织来评估母体状态在样本采集过程中具有复杂性、侵入性和有创性等缺点,并且在对子宫内膜组织进行活检的过程也会造成子宫内膜环境的改变,导致其评估结果具有误差。因此,目前亟需一种能够在胚胎移植前预测患者是否属于rif人群的无创方法。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够无创识别rif的模型训练方法、反复种植失败识别方法、装置、计算机设备、存储介质和计算机程序产品。

2、第一方面,本申请提供了一种模型训练方法,包括:

3、获取样本数据,所述样本数据包括正样本和负样本,所述正样本为胚胎移植成功的第一样本对象的目标血浆mirna的第一测序数据样本,所述负样本为反复种植失败的第二样本对象的目标血浆mirna的第二测序数据样本;

4、分别对所述第一测序数据样本和所述第二测序数据样本进行分析处理,获取所述第一测序数据样本中目标mirna的表达量,以及所述第二测序数据样本中目标mirna的表达量;

5、基于所述第二测序数据样本中目标mirna的表达量进行特征筛选,确定mirna特征集合,所述mirna特征集合用于表征反复种植失败的有效目标mirna的集合;

6、根据所述第一测序数据样本中目标mirna的表达量,确定与mirna特征集合对应的第一表达量集合,根据所述第二测序数据样本中目标mirna的表达量,确定与mirna特征集合对应的第二表达量集合;

7、采用所述第一表达量集合和所述第二表达量集合训练预测模型,直到所述预测模型收敛,得到目标预测模型。

8、在其中一个实施例中,所述分别对所述第一测序数据样本和所述第二测序数据样本进行分析处理,获取所述第一测序数据样本中目标mirna的表达量,以及所述第二测序数据样本中目标mirna的表达量,包括:对所述第一测序数据样本进行过滤,将过滤后的第一测序数据样本与目标数据库进行比对,得到比对上的目标mirna,根据比对上的目标mirna,获取所述第一测序数据样本中每个目标mirna的表达量;对所述第二测序数据样本进行过滤,将过滤后的第二测序数据样本与目标数据库进行比对,得到比对上的目标mirna,根据比对上的目标mirna,获取所述第二测序数据样本中每个目标mirna的表达量。

9、在其中一个实施例中,所述基于所述第二测序数据样本中目标mirna的表达量进行特征筛选,确定mirna特征集合,包括:根据所述第二测序数据样本中目标mirna的表达量,确定满足筛选条件的候选mirna集合;基于所述候选mirna集合对所述预测模型进行预训练,确定所述预测模型的特征重要性系数;根据所述特征重要性系数从所述候选mirna集合中确定mirna特征集合。

10、在其中一个实施例中,所述根据所述第二测序数据样本中目标mirna的表达量,确定满足筛选条件的候选mirna集合,包括:根据所述第二测序数据样本中目标mirna的表达量,确定满足表达量阈值及其分布的初始mirna集合;计算初始mirna集合中任意两个mirna之间的相关性,当所述相关性高于相关性阈值时,从初始mirna集合中删除所述任意两个mirna中的一个mirna;根据所述第二测序数据样本的样本标签,基于统计学方法从删除处理后的初始mirna集合中获取满足统计条件的mirna作为候选mirna集合。

11、在其中一个实施例中,所述根据所述第一测序数据样本中目标mirna的表达量,确定与mirna特征集合对应的第一表达量集合,根据所述第二测序数据样本中目标mirna的表达量,确定与mirna特征集合对应的第二表达量集合,包括:根据所述mirna特征集合,对所述第一测序数据样本中对应mirna的表达量进行归一化和标准化处理,得到处理后的与所述mirna特征集合对应的第一表达量集合;根据所述mirna特征集合,对所述第二测序数据样本中对应目标mirna的表达量进行归一化和标准化处理,得到处理后的与所述mirna特征集合对应的第二表达量集合。

12、第二方面,本申请提供了一种反复种植失败识别方法,所述方法包括:

13、获取待识别样本的测序数据,所述待识别样本为目标对象的目标血浆mirna样本;

14、对所述待识别样本的测序数据进行分析处理,获取所述测序数据中目标mirna的表达量;

15、基于上述的方法中确定的mirna特征集合,以及所述测序数据中对应目标mirna的表达量,确定与所述mirna特征集合对应的目标表达量集合;

16、将所述目标表达量集合输入目标预测模型,得到所述目标预测模型输出的预测结果,所述预测结果用于表征所述目标对象是否为rif,所述目标预测模型采用如上述的方法训练得到。

17、第三方面,本申请提供了一种模型训练装置,所述装置包括:

18、样本数据获取模块,用于获取样本数据,所述样本数据包括正样本和负样本,所述正样本为胚胎移植成功的第一样本对象的目标血浆mirna的第一测序数据样本,所述负样本为反复种植失败的第二样本对象的目标血浆mirna的第二测序数据样本;

19、数据分析模块,用于分别对所述第一测序数据样本和所述第二测序数据样本进行分析处理,获取所述第一测序数据样本中目标mirna的表达量,以及所述第二测序数据样本中目标mirna的表达量;

20、特征筛选模块,用于基于所述第二测序数据样本中目标mirna的表达量进行特征筛选,确定mirna特征集合,所述mirna特征集合用于表征反复种植失败的有效目标mirna的集合;

21、表达量本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述分别对所述第一测序数据样本和所述第二测序数据样本进行分析处理,获取所述第一测序数据样本中目标miRNA的表达量,以及所述第二测序数据样本中目标miRNA的表达量,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述第二测序数据样本中目标miRNA的表达量进行特征筛选,确定miRNA特征集合,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第二测序数据样本中目标miRNA的表达量,确定满足筛选条件的候选miRNA集合,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述第一测序数据样本中目标miRNA的表达量,确定与miRNA特征集合对应的第一表达量集合,根据所述第二测序数据样本中目标miRNA的表达量,确定与miRNA特征集合对应的第二表达量集合,包括:

6.一种反复种植失败识别方法,其特征在于,所述方法包括:

7.一种模型训练装置,其特征在于,所述装置包括:

8.一种反复种植失败识别装置,其特征在于,所述装置包括:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述分别对所述第一测序数据样本和所述第二测序数据样本进行分析处理,获取所述第一测序数据样本中目标mirna的表达量,以及所述第二测序数据样本中目标mirna的表达量,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述第二测序数据样本中目标mirna的表达量进行特征筛选,确定mirna特征集合,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第二测序数据样本中目标mirna的表达量,确定满足筛选条件的候选mirna集合,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述第一测序数据样本中目标mirn...

【专利技术属性】
技术研发人员:钱俊邢彦如盛磊康瑛许瑞霞孔令印梁波
申请(专利权)人:苏州贝康医疗器械有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1