System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物,涉及一种与早产发生相关的靶标基因组合及其应用。
技术介绍
1、早产(preterm birth)的定义为妊娠37周前发生分娩的现象,这是一种受多因素多组织影响的复杂的综合征。传统的产前筛查自发性早产的方法是基于产妇的特征,如年龄、吸烟状况和生育史等一系列风险因素,风险评分装置试图根据这些母体因素来定义女性早产的高风险或低风险;或是通过超声波检测宫颈长度从而进行预测。其他方法包括对产妇的羊水、宫颈液或血清的分子标志物进行检测评估。对于早产风险的预测可以提醒人们提前干预,在一定程度上防止/推迟早产的发生。
2、当前,早产的风险评估基本是基于产妇生理指标、早产史等风险因素、宫颈长度以及血清、羊水或宫颈液中分子标志物进行预测。
3、超声检测宫颈长度虽表现出较好的预测效果,但因在妊娠过程中存在早产风险的宫颈缩短时期模式存在不同,检测宫颈长度预测早产只能对某一种宫颈缩短模式有效,对于其他模式预测能力欠佳。并且超声检测对于预测后一周内早产有效果,对于间隔时期较长的早产现象预测能力不足。
4、分子标志物方面,如宫颈液中的胎儿纤维连接蛋白、胰岛素样生长因子结合蛋白-1(igfbp-1);羊水中的基质金属蛋白酶-8(mmp-8)、血管生成因子(sflt-1)、血管内皮生长因子(vegf);母体血清甲胎蛋白(afp)/羊水甲胎蛋白(afp)的比值均在一定程度上可反映早产的几率。但这些预测均为单分子预测,不同分子存在不同的最佳预测时间,如胎儿纤维连接蛋白在检测后的7-10天预测准确性最佳,mmp-
5、综上所述,由于疾病发病机制的复杂性,目前尚无多基因指标联合用于自发性早产的早期临床预测的报道,因此,挖掘有效的早期分子标志物成为自发性早产前期临床诊疗领域的关键问题。
技术实现思路
1、针对现有技术的不足和实际需求,本专利技术提供一种与早产发生相关的靶标基因组合及其应用,以期解决目前尚无方法准确的预测自发性早产发生的问题。
2、为达上述目的,本专利技术采用以下技术方案:
3、第一方面,本专利技术提供一种与早产发生相关的靶标基因组合,所述靶标基因组合包括clint1、dgka、lefty2、atp8b3、nphp3、rab40c、nfyc-as1和pttg1。
4、本专利技术研究发现,外周血游离dna在某些基因转录起始位点区域的分布情况在早产和对照组存在差异,对游离dna tss特征进行均一化校正后,通过不同差异基因的优选组合,模型构建过程中使用机器学习方法,在独立测试集中预测效果接收者操作特征曲线(receiver operating characteristic curve,roc)中的曲线下面积(area underthecurve,auc)达到0.8以上,为早产预测提供新观测角度与预测方法。
5、第二方面,本专利技术提供第二方面所述的与早产发生相关的靶标基因组合的检测试剂在制备早产筛查产品中的应用。
6、第三方面,本专利技术提供一种用于早产检测的装置,所述用于早产检测的装置统包括:
7、样本分析模块:将样本测序数据比对到参考基因组上并获取每个基因的转录起始位点区域覆盖情况;
8、筛选特征模块:筛选预测早产的特征基因;
9、构建模型模块:构建预测早产的模型;
10、计算模块:将待预测样本的特征基因表达数据,输入至所述预测早产的模型,利用模型进行计算输出患早产的概率;
11、所述特征基因为权利要求1所述的与早产发生相关的靶标基因组合。
12、优选地,所述样本分析模块用于进行包括如下的操作:
13、(1-1)获取样本的高通量测序原始数据与参考基因组进行比对,并按照染色体进行排序;
14、(1-2)对比对的结果进行去重复;
15、(1-3)统计每个基因的转录起始位点区域的覆盖深度,对每个转录起始位点区域的覆盖深度加和得到每个基因的tssdepth;
16、(1-4)将每个基因的转录起始位点区域按照公式(1)进行标准化得到每个基因的转录起始位点区域的特征;
17、tssi normalized=tssi depth/total tssdepth×106 公式(1);
18、其中,tssi normalized为基因i的转录起始位点区域的特征,tssi depth为基因i的转录起始位点区域的覆盖深度,total tssdepth为所有基因的转录起始位点区域的覆盖深度加和;tssdepth的含义为:转录本起始位点上下游0.5~5kb区域中每个位点测序覆盖度的加和。
19、优选地,所述样本包括血浆游离dna。
20、优选地,所述转录起始位点区域的大小为转录起始位点上下游0.5~5kb,包括但不限于0.6kb、0.7kb、0.8kb、1kb、1.5kb、1.8kb、2kb、2.5kb、3kb、3.5kb、4kb、4.5kb、4.6kb或4.8kb等。
21、优选地,所述筛选特征模块用于进行包括如下的操作:
22、(2-1)将早产患者和正常孕妇按照孕周进行匹配,使用差异分析软件寻找两组样本转录起始位点区域有显著差异的基因;
23、(2-2)使用最小绝对值收敛和选择算子对(2-1)差异基因筛选,得到预测模型的特征基因。
24、优选地,所述构建模型模块用于进行包括如下的操作:
25、(3-1)获取最佳截断值:按照公式(2)计算特征基因区分对照组和疾病组的最佳截断值best cut-off;
26、best cut-off=median(tssi normalized) 公式(2);
27、其中,median(tssi normalized)表示基因i在全部样本中转录起始位点区域丰度的中位值;
28、(3-2)特征基因离散化:按照最佳截断值根据公式(3)将训练集样本中特征基因的转录起始位点tssi normalized进行离散化转化为0或1;
29、公式(3):
30、tssi=1,tssi normalized>best cut-off;
31、tssi=0,tssi normalized<=best cut-off;
32、其中,tssi为基因i最终离散化后的特征值;
33、(3-3)构建模型:使用机器学习的方法基于特征基因和孕周构建预测早产的模型。
34、优选地,所述机器学习的方法包括但不限于随机森林、袋装树等两种。
35、优选地,(3-3)还包括使用10次交叉验证的方法对模型参数进行优化。
36、优选地,所述计算模块用于进行包括如下的操作:
37、将待预测样本的特征基因表达数据,输入至早产预测模型本文档来自技高网...
【技术保护点】
1.一种与早产发生相关的靶标基因组合,其特征在于,所述靶标基因组合包括CLINT1、DGKA、LEFTY2、ATP8B3、NPHP3、RAB40C、NFYC-AS1和PTTG1。
2.权利要求1所述的与早产发生相关的靶标基因组合的检测试剂在制备早产筛查产品中的应用。
3.一种用于早产检测的装置,其特征在于,所述用于早产检测的装置统包括:
4.根据权利要求3所述的用于早产检测的装置,其特征在于,所述样本分析模块用于进行包括如下的操作:
5.根据权利要求4所述的用于早产检测的装置,其特征在于,所述样本包括血浆游离DNA;
6.根据权利要求3-5任一项所述的用于早产检测的装置,其特征在于,所述筛选特征模块用于进行包括如下的操作:
7.根据权利要求3-6任一项所述的用于早产检测的装置,其特征在于,所述构建模型模块用于进行包括如下的操作:
8.根据权利要求3-7任一项所述的用于早产检测的装置,其特征在于,所述计算模块用于进行包括如下的操作:
9.根据权利要求3-8任一项所述的用于早产检测的装置,
10.根据权利要求3-9任一项所述的用于早产检测的装置,其特征在于,判断是早产阳性的标准为:
...【技术特征摘要】
1.一种与早产发生相关的靶标基因组合,其特征在于,所述靶标基因组合包括clint1、dgka、lefty2、atp8b3、nphp3、rab40c、nfyc-as1和pttg1。
2.权利要求1所述的与早产发生相关的靶标基因组合的检测试剂在制备早产筛查产品中的应用。
3.一种用于早产检测的装置,其特征在于,所述用于早产检测的装置统包括:
4.根据权利要求3所述的用于早产检测的装置,其特征在于,所述样本分析模块用于进行包括如下的操作:
5.根据权利要求4所述的用于早产检测的装置,其特征在于,所述样本包括血浆游离dna;...
【专利技术属性】
技术研发人员:乔龙威,邢彦如,刘欢,王挺,张春花,薛莹,黄超,孔令印,梁波,
申请(专利权)人:苏州市立医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。