一种肺癌预测模型的训练方法以及预测装置和应用制造方法及图纸

技术编号:37333516 阅读:14 留言:0更新日期:2023-04-21 23:11
本发明专利技术公开了一种肺癌预测模型的训练方法以及预测装置和应用,涉及生物检测技术领域。本发明专利技术发现了新的肺癌标志物,具体可参照表1,与传统临床检测的手段以及现有标志物相比,具有更好的灵敏度和特异性,为肺癌的有效筛查提供了途径。筛查提供了途径。筛查提供了途径。

【技术实现步骤摘要】
一种肺癌预测模型的训练方法以及预测装置和应用


[0001]本专利技术涉及生物检测
,具体而言,涉及一种肺癌预测模型的训练方法以及预测装置和应用。

技术介绍

[0002]肺癌为全球发病率和死亡率最高的恶性肿瘤,而诊断时的临床分期是影响肺癌患者5年生存率的关键,早期肺癌可达92%,而晚期仅5.8%,因此,早期诊断是改善肺癌患者预后的关键。然而,国外的肺癌筛查主要基于胸部影像以及分子标志物,但不太适合中国人群。
[0003]肺癌早诊早治的难点包括以下几个方面:一是早期肺癌无特征性影像学表现,缺乏新型影像分析技术鉴别诊断早期肺癌;二是早期肺癌患者常无特征性临床症状,缺乏高危人群的甄别标准及适宜筛查方案;三是缺乏高准确性的肺癌早诊早治标志物,传统的CEA等分子,诊断早期肺癌的敏感性低于50%,临床缺乏指导早诊早治的精准指标;四是肺部小结节容易漏诊,性质难以判别,人工标注存在耗时耗人的瓶颈,人工智能面临“小数据和数据组间”不平衡的问题。
[0004]当前肺癌的常用检测方案主要包括酶学检测:血浆肿瘤标志物检测是常用于肺癌筛查和术后监测的常用临床检测手段;癌胚抗原(CEA)是一种“广谱”的肿瘤标志物,有研究表明,CEA诊断肺癌的灵敏度和特异性分别为69%和68%。临床上肺癌比较常用的标志物还有细胞角质蛋白19片段抗原(CYFRA21

1)及神经元特异性烯醇化酶(NSE)抗原,此两种抗原分别在诊断鳞癌和小细胞癌中更有优势。但是由于肿瘤的异质性,尚未发现特异性和灵敏度足够高的用于诊断早期肺癌的肿瘤标志物。如碱性磷酸酶,在肝癌和骨肉瘤患者中可明显升高;糖蛋白,如肺癌血清
ɑ
酸性糖蛋白可有升高,消化系统肿瘤CA19

9等增高;肿瘤相关抗原,如癌胚抗原(CEA)在胃肠道肿瘤、肺癌和乳腺癌中可出现增高,甲胎蛋白(AFP)在肝癌和恶性畸胎瘤中可增高。目前,肿瘤标记物缺乏特异性,仅在辅助诊断和判断预后等方面仍有一定价值。
[0005]自20世纪90年代起,随着胸部低剂量CT(low

dose computed tomography,LDCT)技术的发展,肺癌筛查进入LDCT时代,临床研究结果显示,与X线胸片相比,采用LDCT对肺癌高危人群进行筛查可使肺癌病死率下降20%。肺癌筛查能够有效地发现I期肺癌及非小细胞肺癌,但是LDCT筛查在发现恶性结节的同时,也检出了大量良性和性质难以确定的结节,导致了很高的假阳性率。很多假阳性结节需要接受进一步的侵袭性检查,从而增加了受试者的焦虑心理,少部分患者还会因为接受侵袭性检查而产生相应的并发症。LDCT的过度诊断会导致假阳性结果的出现。在针对肺癌开展的CT筛查项目中是否存在过度诊断还不甚明了,但有研究显示约10%

12%由肺癌筛查确定的癌症病例属于过度诊断。
[0006]鉴于此,特提出本专利技术。

技术实现思路

[0007]本专利技术的目的在于提供一种肺癌预测模型的训练方法以及预测装置和应用。
[0008]本专利技术是这样实现的:
[0009]第一方面,本专利技术实施例提供了检测标志物甲基化水平的试剂在制备预测肺癌的产品中的应用,所述标志物包括标志物1~127中的至少50种;其中,以下表格中的每一项所对应的标志物包括对应的CpG位点和/或覆盖对应CpG位点的区域:
[0010]表1标志物
[0011][0012][0013][0014][0015][0016]以hg19参考基因组序列为基准。
[0017]第二方面,本专利技术实施例还提供了一种用于诊断或辅助诊断肺癌的试剂盒,其包括前述实施例所述的检测标志物甲基化水平的试剂。
[0018]第三方面,本专利技术实施例提供了一种肺癌预测模型的训练方法,其包括:获取训练样本的标志物甲基化结果以及标注结果;其中,所述标志物如前述实施例所述,所述标志物结果为代表样本肺癌的患病风险、疾病进程和预后风险中的至少一种情况的标签;将所述训练样本的标志物的甲基化结果输入预先构建的预测模型中,获得预测结果;所述预先构建的预测模型为能给根据所述标志物的甲基化水平预测肺癌的患病风险、疾病进程和预后风险中的至少一种的机器学习模型;基于所述标注结果和所述预测结果对预先构建的预测模型进行参数更新。
[0019]第四方面,本专利技术实施例提供了一种肺癌预测装置,其包括获取模块和预测模块。获取模块,用于获取待测样本的标志物的甲基化水平,所述标志物如前述实施例所述;预测模块,用于将获得的标志物的甲基化水平输入如前述实施例所述的训练方法训练好的预测模型中,获得预测结果。
[0020]第五方面,本专利技术实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器用于存储程序,当所述程序被所述处理器执行时,使得所述处理器实现如前述实施例所述的训练方法或肺癌的预测方法,所述预测方法的步骤包括:获取待测样本的
标志物的甲基化水平,所述标志物如前述实施例所述,将获得的标志物的甲基化水平输入如前述实施例所述的训练方法训练好的预测模型中,获得预测结果。
[0021]第六方面,本专利技术实施例提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理执行时实现如前述实施例所述的训练方法或如前述实施例所述的预测方法。
[0022]本专利技术具有以下有益效果:
[0023](1)本专利技术发现了新的肺癌标志物,与传统临床检测的手段以及现有标志物相比,具有更好的灵敏度和特异性;
[0024](2)与临床影像学检测手段相比,更安全,无创,不受检测人体质的影响;
[0025](3)本专利技术仅需采集少量血液即可完成,而影像学检查受到某些脏器的生理活动的影响以及某些特殊体质病人无法进行检测,且某些放射性物质会对身体有一定的损伤。
附图说明
[0026]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0027]图1为本专利技术数据处理步骤的技术路线图;
[0028]图2为127个标志物的甲基化丰度在不同样本中的分布差异;
[0029]图3为127个标志物构建的预测模型在不同恶性程度样本中的预测结果;
[0030]图4为127个标志物构建的预测模型的ROC曲线图;
[0031]图5为50个标志物构建的预测模型的ROC曲线图。
具体实施方式
[0032]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将对本专利技术实施例中的技术方案进行清楚、完整地描述。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
[0033]随着高通量测序技术的发展及其应用的不断拓展,液体活检,特别是对于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.检测标志物甲基化水平的试剂在制备预测肺癌的产品中的应用,其特征在于,所述标志物包括标志物1~127中的至少50种;其中,以下表格中的每一项所对应的标志物包括对应的CpG位点和/或含有对应CpG位点的区域:
以hg19参考基因组序列为基准。2.根据权利要求1所述的应用,其特征在于,所述标志物包括标志物1~50;优选地,所述标志物包括标志物1~127。3.根据权利要求1或2所述的应用,其特征在于,所述肺癌包括早期肺癌、中期肺癌和晚期肺癌;优选地,所述预测肺癌包括:预测肺癌的患病风险、疾病进程和预后风险中的至少一种。4.根据权利要求1或2所述的应用,其特征在于,所述检测标志物甲基化水平的试剂包括甲基化测序试剂、甲基化特异性PCR试剂、甲基化敏感性单核苷酸引物延伸试剂、甲基化敏感性单链构象分析试剂和甲基化敏感性变性梯度凝胶电泳试剂中的至少一种;优选地,所述甲基化测序试剂包括重亚硫酸盐试剂、测序建库试剂和PCR扩增试剂;优选地,所述产品包括试剂、试剂盒和预测模型中的至少一种。5.一种用于诊断或辅助诊断肺癌的试剂盒,其特征在于,其包括权利要求1~4任一项所述的检测标志物甲基化水平的试剂。6.一种肺癌预测模型的训练方法,其特征在于,其包括:获取训练样本的标志物甲基化结果以及标注结果;其中,所述标志物如权利要求1~5任一项所述,所述标志物结果为代表样本肺癌的患病风险、疾病进程和预后风险中的至少一种情况的标签;将所述训练样本的标志物的甲基化结果输入预先构建的预测模型中,获得预测结果;所述预先构建的预测模型为能给根据所述标志物的甲基化水平预测肺癌的患病风险、疾病进程和预后风险中的至少一种的机器学习模型;基于所述标...

【专利技术属性】
技术研发人员:陈克终杨浩杨帆杜凤霞李运张雪莹陈碧思白健郑璐王寅吴佳妍杨爱蓉周进兴吴琳
申请(专利权)人:福建和瑞基因科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1