基于血清miRNA的胰腺癌诊断的机器学习系统技术方案

技术编号:33629901 阅读:13 留言:0更新日期:2022-06-02 01:31
本发明专利技术公开了基于本团队发明专利技术“一种体外辅助诊断胰腺癌的试剂盒”(CN 104745678 B)所述的一系列检测指标,基于试剂盒上市前后的一系列临床检测数据,开发了一种机器学习的诊断系统,对比原计算方法,本发明专利技术可大幅提升原诊断试剂盒在临床应用中的稳定性和准确性。试剂盒在临床应用中的稳定性和准确性。

【技术实现步骤摘要】
基于血清miRNA的胰腺癌诊断的机器学习系统


[0001]本专利技术属于生物技术与机器学习领域,涉及基于血清microRNA结合机器学习方法在胰腺癌诊断判别中的应用。

技术介绍

[0002]胰腺癌被称为癌中之王,全球总体发病率和死亡率逐年上升,预计在2030年将成为恶性肿瘤的第二大杀手。胰腺癌具有高发病率、高复发转移率、高死亡率、低早期诊断率、低切除率、低药物有效率和低生存率三高四低的特点。胰腺癌防治效果差的主要原因包括病因不清、无法预防,早期诊断困难,早诊率仅为5%。现有治疗手段的效果均已达到瓶颈,短期内难有突破,5年生存率仅为7.2%,胰腺癌患者的5年生存率在恶性肿瘤中最低。
[0003]检查方法包括B超检查、电子计算机X线断层扫描(CT)、磁共振(MRI)、磁共振胰胆管成像(MRCP)、正电子发射断层扫描(PET)、正电子发射断层扫描(PET)以及超声内镜检查(EUS)、经口胰管镜(POPS)、胰管内超声检查(PIDUS)等。但由于胰腺位置隐匿,内镜及影像学技术的诊断效果有限。目前,用于胰腺癌诊断和随访的肿瘤标记物有10余种,但迄今为止尚未找到一种对胰腺癌诊断灵敏性和特异性都十分满意的肿瘤标志物。因此各指标单独使用对胰腺癌早期诊断价值不大,可用于判断胰腺癌切除后是否有残余病灶以及复发的监测。常用的肿瘤标志物包括CA19

9、CEA(癌胚抗原)。但是,上述肿瘤标记物的灵敏度和特异性相对较低,它们的检测结果还不能作为胰腺癌确诊的指标。
[0004]MicroRNA为一类长约19<br/>‑
23个核苷酸的单链小核糖核酸(RNA)分子,位于基因组非编码区,进化上高度保守,可以通过抑制靶基因的翻译(Translation)过程对基因表达进行调节。微小核糖核酸参与正常生理活动,如生物个体发育、组织分化、细胞凋亡以及能量代谢等,也与许多疾病的发生及发展存在着紧密的联系。本团队率先发现血清中microRNA在各种环境中表达非常稳定,并且与多种疾病的发生、发展具有极强的相关性;再加上其取材便利,使得血清microRNA具备了成为优异生物标志物的潜质,具有良好的开发应用前景。同时,我们的大量实验研究发现人血清中的miR

25与胰腺癌发生具有相关性,基于此发现提出了血清miR

25可以作为一个新的胰腺癌检测靶标,在制备胰腺癌诊断试剂中应用。
[0005]目前microRNA检测方法主要通过荧光定量PCR检测方法。该方法需要测序人员具有一定的分子生物学实验技能。同时不同人员、不同荧光定量PCR仪均会对该检测方法最终的稳定性产生影响。针对该问题,本团队基于专利技术“一种体外辅助诊断胰腺癌的试剂盒”(CN 104745678 B)所述的一系列检测指标,基于试剂盒上市前后的一系列临床实验数据,开发了一种机器学习的诊断系统,该系统比原方法具有更强的鲁棒性,能有效提高试剂盒的准确性。

技术实现思路

[0006]本专利技术的目的是基于本团队专利技术“一种体外辅助诊断胰腺癌的试剂盒”(CN 104745678 B)所述的一系列检测指标,基于试剂盒上市前后的一系列临床检测数据,开发
了一种机器学习的诊断系统,用于提高原诊断试剂盒的鲁棒性和准确率。
[0007]具体的本专利技术包括以下几个内容:
[0008](1)建立胰腺癌诊断信息数据库。收集专利技术“一种体外辅助诊断胰腺癌的试剂盒”(CN 104745678 B)的关联产品在临床注册阶段时获得的样本数据与上市后临床研究获得的样品数据。准确记录每次实时荧光定量PCR仪的产生的数据,包括:miR

25的CT值(或称为CP值)、内参的CT值(或称为CP值)、miR

25阳性对照CT值(或称为CP值)、miR

25阴性对照CT值(或称为CP值)、miR

25空白对照CT值(或称为CP值)、标准品(包括S1、S2、S3、S4)CT值(或称为CP值)、内参阳性对照CT值(或称为CP值)、内参阴性对照CT值(或称为CP值)、内参空白对照CT值(或称为CP值)、具体的实验批次信息和样品临床信息(是否为胰腺癌)。
[0009](2)确定基于机器学习的胰腺癌诊断模型。利用支持向量机(SVM)的算法,使用上述数据库的中的数据作为特征,使用这些特征及其相关组合作为输入、样品临床信息(是否为胰腺癌)作为输出,构建胰腺癌的分类模型。
[0010](3)建立基于血清miRNA的胰腺癌诊断系统。基于miR

25和内参的CT值(或称为CP值)与对应阳性、阴性及空白对照的CT值(或称为CP值)的对比,确定实验样品及过程是否合格,基于模型输出的决定值的分析判定样品为胰腺癌阳性、胰腺癌阴性、或疑似胰腺癌阳性。
[0011]优选地,在本专利技术的基于基于血清miRNA的胰腺癌诊断的机器学习系统的方法中,所述步骤(2)的确定基于机器学习的胰腺癌诊断模型包括对数据的预处理,包括:
[0012](a)基于miR

25与内参CT值(或称为CP值)的数据分布,进行数据的标准化和中心化,包括基于正态分布、二项分布、负二项分布、柏松分布等分布的参数估计方法的标准化和中心化方法。
[0013](b)基于标准品、miR

25和内参的CT值(或称为CP值)的标准化。利用标准品计算一个miR

25的CT值(或称为CP值)与已知摩尔浓度的标准曲线,利用该标准曲线标准化miR

25和内参的数值。
[0014](c)miR

25与内参CT值(或称为CP值)及其标准化或中心化的数值的相加、相减、相乘及相除。
[0015]优选地,在本专利技术的基于基于血清miRNA的胰腺癌诊断的机器学习系统的方法中,所述支持向量机算法核函数包括线性核(Linear Kernel)、多项式核(Polynomial Kernel)、径向基核函数(Radial Basis Function)、高斯核(Gaussian Kernel)幂指数核(Exponential Kernel)、拉普拉斯核(Laplacian Kernel)、ANOVA核(ANOVA Kernel)、二次有理核(Rational Quadratic Kernel)、多元二次核(Multiquadric Kernel)逆多元二次核(Inverse Multiquadric Kernel)、Sigmoid核(Sigmoid Kernel)及其他可能的核函数。
[0016]优选地,在本专利技术的基于基于血清miRNA的胰腺癌诊断的机器学习系统的方法中,所述支持向量机算法核函数线性核(Linear Kernel)。
[0017]优选地,在本专利技术的基于基于血清miRNA的胰腺癌诊断的机器学习系统的方法中,所述评价指数包括精确度、召回率和F1分数。
[0018]优选地,在本专利技术的基于基于血清miR本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于发明“一种体外辅助诊断胰腺癌的试剂盒”(CN 104745678 B)所述的一系列血清miRNA检测指标的胰腺癌机器学习诊断系统。2.优选地,在本发明的基于基于血清miRNA的胰腺癌诊断的机器学习系统的方法中,所述支持向量机算法核函数包括线性核(Linear Kernel)、多项式核(Polynomial Kernel)、径向基核函数(Radial Basis Function)、高斯核(Gaussian Kernel)幂指数核(Exponential Kernel)、拉普拉斯核(Laplacian Kernel)、ANOVA核(ANOVA Kernel)、二次有理核(Rational Quadratic Kernel)、多元二次核(Multiquadric Kernel)逆多元二次核...

【专利技术属性】
技术研发人员:周祯张辰宇管单萍
申请(专利权)人:南京大学人工智能生物医药技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1