当前位置: 首页 > 专利查询>北京大学专利>正文

一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用技术

技术编号:37229292 阅读:6 留言:0更新日期:2023-04-20 23:12
本发明专利技术属于临床检验诊断技术领域,涉及一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用。本发明专利技术所述诊断标志物包括24种血浆代谢标志物中的任意一种或两种以上。本发明专利技术所述诊断标志物对于乳腺癌的诊断具有较好的灵敏性和特异性,可用于乳腺癌诊断(包括早期诊断),对于改善乳腺癌的预后、提高乳腺癌患者的生存率具有重要意义。提高乳腺癌患者的生存率具有重要意义。提高乳腺癌患者的生存率具有重要意义。

【技术实现步骤摘要】
一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用


[0001]本专利技术属于临床检验诊断
,具体涉及一种基于代谢组学和人工智能分析方法筛选鉴定的乳腺癌诊断的诊断标志物、所述诊断标志物在乳腺癌诊断产品制备中的应用、所述诊断标志物的筛选方法、应用所述诊断标志物构建诊断模型的方法。

技术介绍

[0002]乳腺癌(Breast cancer)是乳腺导管上皮及末梢导管上皮发生的恶性肿瘤,近几年来发病率有明显的上升趋势,在临床上属于女性常见病。根据世界卫生组织国际癌症研究机构(IARC)发布的2020年全球最新癌症负担数据,全球乳腺癌新发病例高达226万例,超过了肺癌的220万例,乳腺癌取代肺癌,成为全球第一大癌。2020年中国癌症新发病例中乳腺癌发病率位居第四位,在2020年中国癌症死亡率中位居第七位。
[0003]根据国家癌症中心发布的2022年全国癌症报告,近年来中国乳腺癌发病率与死亡率仍呈逐年递增趋势。乳腺癌发病人数增加,根本原因之一是乳腺癌风险因素的不断变化,比如推迟生育、生育次数减少,超重和肥胖,以及缺乏运动等。
[0004]乳腺癌的确切发病机制尚不明确,相关高危因素难以控制,一级病因预防较难实现,故目前乳腺癌的防控以“早发现、早诊断、早治疗”的二级预防为主。乳腺癌的早期筛查主要依靠于临床影像学检查,但由于医疗资源分配不均、防癌意识相对薄弱、筛查覆盖人群有限以及临床医师水平参差不齐等原因,导致我国早期乳腺癌整体诊断率略显偏低。
[0005]早期乳腺癌术后10年生存率可达90%以上,大大高于中晚期乳腺癌患者。所以,乳腺癌的早期发现至关重要,发现得越早,治愈可能性就越大。然而,早期乳腺癌往往不具备典型的症状和体征,大多为无痛性肿块、乳头溢液,少数伴有隐痛或刺痛。目前使用最广泛的乳腺癌筛查方法是乳腺钼靶X线检查,但因早期乳腺癌肿瘤范围较小且腺体密度较高,使肿瘤图像模糊,导致钼靶X线检查难度较大且误诊率和漏诊率较高。肿瘤标记物包括癌胚抗原(CEA)、癌抗原(CA15

3)等的灵敏度和特异度均难以达到临床诊断标准,且容易受到患者的既往病史和不良嗜好影响。因此开发出一种简单便捷并具有高特异度和高敏感度的新型乳腺癌诊断产品将极大促进乳腺癌的早诊早治、提升疗效和患者的预后,具有重大的临床意义和社会经济意义。

技术实现思路

[0006]本专利技术的目的在于提供一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用。本专利技术所述诊断标志物对于乳腺癌具有较好的灵敏性和特异性,可用于乳腺癌诊断(包括乳腺癌的早期诊断),对于改善乳腺癌的预后、提高乳腺癌患者的生存率具有重要意义。
[0007]本专利技术提供了一种乳腺癌诊断标志物,所述诊断标志物包括以下24种血浆代谢标志物中的任意一种或两种以上:哌啶、肌苷、亮氨酸、尿苷、苯丙氨酸、苏氨酸、N

乙酰

DL


冬氨酸、N

乙酰

DL

谷氨酸、葡萄糖酸、N

乙酰甘氨酸、对氯苯酚、脯氨酸、缬氨酸、左旋肉碱、L

乙酰基肉碱、精氨酸、赖氨酸、酪氨酸、3

甲基黄嘌呤、吲哚
‑3‑
乙醛、3

羟基丁酸、顺乌头酸、2

羟基苯乙酸和磷酸胆碱。
[0008]优选的是,所述诊断标志物包括以下6种血浆代谢标志物中的任意一种或两种以上:哌啶、肌苷、亮氨酸、尿苷、苯丙氨酸和苏氨酸。
[0009]优选的是,所述诊断标志物包括以下1种血浆代谢标志物:哌啶。
[0010]本专利技术还提供了检测上述技术方案所述诊断标志物的试剂在制备乳腺癌诊断产品中的应用,所述产品包括试剂盒。
[0011]本专利技术还提供了一种乳腺癌诊断试剂盒,包括检测上述技术方案所述诊断标志物的试剂。
[0012]本专利技术还提供了上述技术方案所述诊断标志物的筛选方法,包括以下步骤:
[0013]1)使用机器学习支持向量机算法学习经过非靶向代谢组学分析、检索及数据预处理后的二维矩阵数据,随机将乳腺癌及健康对照血浆样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代2000次,通过统计最终支持向量机模型准确度的平均值,确定该支持向量机模型可有效对乳腺癌患者与健康人群的代谢组数据进行分类;
[0014]2)根据上述得到的支持向量机模型,通过基于机器学习的特征筛序,借助支持向量机建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式;所述筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升;
[0015]3)将上述筛选得到的最优特征即目标差异代谢物进行基于质谱的优化筛选,使用MS

Dial软件根据色谱峰型及二级质谱图数据质量筛选并获得潜在代谢标志物;
[0016]4)根据上述潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库中的谱图信息进行比对,从而对代谢物进行鉴定,得到适合于乳腺癌诊断的血浆代谢标志物。
[0017]本专利技术还提供了一种基于上述技术方案所述诊断标志物的乳腺癌诊断模型的构建方法,包括以下步骤:
[0018]1)将乳腺癌患者和健康人群的血浆样本作为分析样本;
[0019]2)使用液相色谱质谱联用仪对每个分析样本进行诊断标志物的靶向代谢组学分析,得到各血浆样本的靶向代谢组图谱;
[0020]3)使用Multiquant软件对乳腺癌患者血浆样本和健康人群血浆样本的靶向代谢组图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的标志物二维矩阵,用于进一步的机器学习;
[0021]4)根据所述诊断标志物的二维矩阵,使用机器学习支持向量机构建分类模型,得到乳腺癌诊断模型。
[0022]本专利技术还提供了上述技术方案所述构建方法构建得到的乳腺癌诊断模型。
[0023]本专利技术还提供了一种基于上述技术方案所述诊断标志物的靶向代谢组学绝对定量方法,包括以下步骤:
[0024]1)标准品准备
[0025](a)制备各诊断标志物的标准储备溶液和同位素内标储备溶液;
[0026](b)准备相应浓度梯度的混合标准品:标准工作校准溶液在合并的标准储备溶液连续稀释后获得,稀释比例为1~1/90;
[0027](c)准备标准品质控品:使用合并的标准储备溶液准备稀释比为3/4、5/12、1/12的标准品质控品,分别定义为高浓度质控品、中浓度质控品、低浓度质控品;
[0028]2)样本制备
[0029](a)配制含有同位素内标的萃取液:将步骤1)获得的同位素内标储备溶液与预冷的甲醇震荡混匀;
[0030](b)萃取样本:将分析样本、标准工作校准样本或标准品质控品与步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种乳腺癌诊断标志物,其特征在于,所述诊断标志物包括以下24种血浆代谢标志物中的任意一种或两种以上:哌啶、肌苷、亮氨酸、尿苷、苯丙氨酸、苏氨酸、N

乙酰

DL

天冬氨酸、N

乙酰

DL

谷氨酸、葡萄糖酸、N

乙酰甘氨酸、对氯苯酚、脯氨酸、缬氨酸、左旋肉碱、L

乙酰基肉碱、精氨酸、赖氨酸、酪氨酸、3

甲基黄嘌呤、吲哚
‑3‑
乙醛、3

羟基丁酸、顺乌头酸、2

羟基苯乙酸和磷酸胆碱。2.根据权利要求1所述的诊断标志物,其特征在于,所述诊断标志物包括以下6种血浆代谢标志物中的任意一种或两种以上:哌啶、肌苷、亮氨酸、尿苷、苯丙氨酸和苏氨酸。3.根据权利要求1所述的诊断标志物,其特征在于,所述诊断标志物包括以下1种血浆代谢标志物:哌啶。4.检测权利要求1~3任一项所述诊断标志物的试剂在制备乳腺癌诊断产品中的应用,所述产品包括试剂盒。5.一种乳腺癌诊断试剂盒,其特征在于,包括检测权利要求1~3任一项所述诊断标志物的试剂。6.权利要求1~3任一项所述诊断标志物的筛选方法,包括以下步骤:1)使用机器学习支持向量机算法学习经过非靶向代谢组学分析、检索及数据预处理后的二维矩阵数据,随机将乳腺癌及健康对照血浆样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代2000次,通过统计最终支持向量机模型准确度的平均值,确定该支持向量机模型可有效对乳腺癌患者与健康人群的代谢组数据进行分类;2)根据上述得到的支持向量机模型,通过基于机器学习的特征筛序,借助支持向量机建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式;所述筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升;3)将上述筛选得到的最优特征即目标差异代谢物进行基于质谱的优化筛选,使用MS

Dial软件根据色谱峰型及二级质谱图数据质量筛选并获得潜在代谢标志物;4)根据上述潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库中的谱图信息进行比对,从而对代谢物进行鉴定,得到适合于乳腺癌诊断的血浆代谢标志物。7.一种基于权利要求1~3任一项所述诊断标志物的乳腺癌诊断模型的构建方法,包括以下步骤:1)将乳腺癌患者和健康人群的血浆样本作为分析样本;2)使用液相色谱质谱联用仪对每个分析样本进行诊断标志物的靶向代谢组学分析,得到各血浆样本的靶向代谢组图谱;3)使用Multiquant软件对乳腺癌患者血浆样本和健康人群血浆样本的靶向代谢组图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的标志物二维矩阵,用于进一步的机器学习;4)根据所述诊断标志物的二维矩阵,使用机器学习支持向量机构建分类模型,得到乳腺癌诊断模型。8.权利要求7所述构建方法构建得到的乳腺癌诊断模型。9.一种基于权利要求1~3任一项所述诊断标志物的靶向代谢组学绝对定量方法,包括
以下步骤:1)标准品准备(a)制备各诊断标志物的标准储备溶液和同位素内标储备溶液;(b)准备相应浓度梯度的混合标准品:标准工作校准溶液在合并的标准储备溶液连续稀释后获得,稀释比例为1~1/90;(c)准备标准品质控品:使用合并的标准储备溶液准备稀释比为3/4、5/12、1/12的标准品质控品,分别定义为高浓度质控品、中浓度质控品、低浓度质控品;2)样本制备(a)配制含有同位素内标的萃取液:将步骤1)获得的同位...

【专利技术属性】
技术研发人员:尹玉新宋华杰
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1