【技术实现步骤摘要】
多癌种早筛模型构建方法以及检测装置
[0001]本专利技术涉及一种包括肺癌(Lung Adenocarcinoma,LUAD)、结直肠癌(Colorectal Carcinoma,CRC) 和肝癌(Primary Liver Cancer,PLC)的多癌种组织起源检测,属于分子生物医学
技术介绍
[0002]肺癌、结直肠癌和肝癌是三种全球死亡率最高的恶性肿瘤。
[0003]肺癌、肝癌和结直肠癌由于早期无明显症状或检测困难导致早期诊断率低。然而,目前市场上的癌症 早筛产品多是针对单癌种预测,若患者需接受多次不同单癌种早筛项目,由于耗时费力且费用高,可能降 低各癌种早筛在广泛人群中的贯彻推广。多癌种的早期筛查不仅覆盖各癌种的早起筛查,且精确检测其组 织起源,预防癌症发展过程中可能出现的未知原发癌而使病情复杂,耽误诊断治疗的情况发生。因此,我 国迫切需要一种同时覆盖以上三种死亡率最高的恶性肿瘤的早筛产品,以更高效、经济、实用地适用于更 广泛人群。
技术实现思路
[0007]本专利技术提供了一种对血 ...
【技术保护点】
【技术特征摘要】
1.多癌种早筛模型的构建方法,所述的模型用于对样本是否患有肠癌、肺癌或者肝癌进行分类,其特征在于,包括如下步骤:步骤1,对阳性组和对照组的样本进行cfDNA的提取并测序,获得读段数据;步骤2,将读段数据结果比对至参考基因组,将参考基因组划分为多个窗口,并分别获得在每个窗口范围内的全部读段数量、短读段数量和超长读段数量,作为第一特征集合;步骤3,将读段数据结果比对至参考基因组,分别以各个染色体上的长臂和短臂作为区域范围,并获得在每个范围内的不同长度梯度区间中的读段数量,作为第二特征集合;步骤4,将读段数据中的5
’
端的m个碱基数据作为碱基片段集合,并得到各种碱基片段在全部片段中所占比例作为第三特征集合;步骤5,将读段数据结果比对至参考基因组,得到读段的5
’
端在参考基因组上的位置;获得所述的位置处的上下游各n个bp碱基的序列数据,作为碱基片段集合;以得到的各种碱基片段在全部片段中的所占比例作为第四特征集合;步骤6,将参考基因组划分为多个窗口,并分别获得在每个窗口范围内的拷贝数数据,作为第五特征集合;步骤7,以第一、第二、第三、第四和第五特征集合共同作为初始特征值,作为模型特征向量输入至分类模型中,并以是否患癌作为输出值,对模型进行训练,获得早筛模型。2.根据权利要求1所述的多癌种早筛模型的构建方法,其特征在于,所述的步骤6中,患癌是指患有肠癌、肺癌或者肝癌中的任意一种;所述的步骤6中,还需要对初始特征值进行简化后再作为模型特征向量,所述的简化是指分别筛选出第一、第二、第三、第四和第五特征集合在阳性组和对照组的样本之间存在显著性差异的特征值;所述的筛选过程是通过方差分析方法3.根据权利要求1所述的多癌种早筛模型的构建方法,其特征在于,所述的短读段是指长度40
‑
80bp,所述的超长读段数量是200
‑
300bp;全部读段是指长度在40
‑
300bp范围;所述的步骤2中窗口的大小范围是2
‑
7Mb。4.根据权利要求1所述的多癌种早筛模型的构建方法,其特征在于,所述的步骤3中不同长度梯度区间是指在40
‑
300bp范围内以8
‑
12bp步长递增而得到的不同长度梯度范围;所述的读段数量经过了标准化处理。5.根据权利要求1所述的多癌种早筛模型的构建方法,其特征在于,所述的步骤4中,m是6
‑
10之间的任意整数;所述的步骤5中,n是2
‑
5之间的任意整数;6.根据权利要求1所述的多癌种早筛模型的构建方法,其特征在于,所述的步骤6中的窗口是将参考基因1
‑
22号染色体以0.8
‑
1.2Mb的长度无重叠划分得到的;所述的步骤7中输入至分类模型是指分别将第一、第二、第三、第四和第五特征集合输入至广义线性模型、梯度提升算法模型、随机森林模型、深度学习模型和极端梯度提升模型中,获得多个子模型,并将子模型联立为线性关系模型。7.多癌种检测装置,其特征在于,所述的装置用于样本是否患有肠癌、肺癌或者肝癌进行分类,包括:测序模块,用于对阳性组和对照组的样本进行cfDNA的提取并测序,获得读段数据;第一特征集合获取模块,用于将读段数据结果比对至参考基因组,将参考基因组划分为多个窗口,并分别获得在每个窗口范围内的全部读段数量、短读段数量和超长读段数量,
作为第一特征集合;第二特征集合获取模块,用于将读段数据结果比对至参考基因组,分别以各个染色体上的长臂和短臂作为区域范围,并获得在每个范围内的不同长度梯度区间中的读段数量,作为第二特征集合;第三特征集合获取模块,用于将读段数据中的5
’
端的m个碱基数据作为碱基片段集合,并得到各种碱基片段在全部片段中所占比例作为第三特征集合;第四特征集合获取模块,用于将读段数据结果比对至参考基因组,得到读段的5
’
端在参考基因组上的位置;获得所述的位置处的上下游...
【专利技术属性】
技术研发人员:邵阳,吴雪,包华,刘睿,吴舒雨,唐皖湘夫,杨珊珊,刘思思,孟齐,王婷婷,
申请(专利权)人:南京世和医疗器械有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。