评估甲状腺结节恶性程度或概率的系统、模型及试剂盒技术方案

技术编号:33274373 阅读:15 留言:0更新日期:2022-04-30 23:32
本发明专利技术涉及一种评估甲状腺结节恶性程度或概率的系统、模型及试剂盒。本发明专利技术的方法包括采用压力循环技术对细针穿刺组织活检样本进行处理,通过高效液相色谱方法和质谱方法检测所得到的样本中目标蛋白或多肽的蛋白质组学数据,通过质谱数据的肽段峰面积信息进行处理和AI建模后,得到最终的评估结果(恶性概率),能够为临床提供甲状腺结节恶性程度的参考,其中,对于现有临床无法鉴定的甲状腺结节,亦能够同时提供第二个评估结果(恶性概率)供医生参考。本发明专利技术还提供相应的试剂盒、系统、评估模型及相关用途。估模型及相关用途。估模型及相关用途。

【技术实现步骤摘要】
评估甲状腺结节恶性程度或概率的系统、模型及试剂盒


[0001]本专利技术涉及医学检测领域,并具体涉及一种基于靶向检测蛋白或多肽与机器学习对甲状腺结节恶性程度评估的方法。

技术介绍

[0002]甲状腺结节(Thyroid Nodules)是一种常见的临床病症,根据尸检报告显示,甲状腺结节在普通人群中发病率约50%至60%,多发于女性人群。绝大多数甲状腺结节患者没有临床症状,常常是通过体检或自身触摸发现。在通过病理检查发现的甲状腺结节中,只有5%至15%的结节为恶性结节,即甲状腺癌。
[0003]目前临床指南推荐的甲状腺结节的评估主要基于以下三点:一是高分辨率的超声探查,二是血生化指标,三是细针穿刺组织活检(Fine needle aspiration biopsy, FNAB或FNA)。在以上三种检查中,FNA被认为是对可疑甲状腺结节患者的临床管理中最敏感、最经济的可靠检测方法。然而,FNA结果符合率的高与低通常需要取决于穿刺操作者、细胞病理医生的技术和经验,并且仍有15%至30%的甲状腺结节不能通过FNA和细胞病理学得到清楚地评估。针对不确定性甲状腺结节的处理方式,主流观点是进行甲状腺全切或近半切。但大多数术后病理证实为良性结节,这显然会导致过度诊断和过度治疗。
[0004]因此目前临床上的诊断标准和治疗方案对无症状的甲状腺结节患者并无益处。患者将支付高昂的手术费用以及甲状腺切除后需终身服用替代激素,甚至承担手术可能会带来的甲状腺危象及术后复发等风险。
[0005]近年来,随着分子技术的发展,为了提高对不确定性甲状腺结节的精准诊断,基于甲状腺组织DNA与RNA的分子诊断方法应运而生。在美国,目前已有两个基于基因检测的用于划分此类结节的类别检查推向临床,一个是Afirma,另一个是ThyroSeq。虽然二者具有很高NPV(Negative Predictive Value),但其PPV(Positive Predictive Value)很低。换言之,这两种方法仅对部分的良性结节有很好的分类,对于是否有恶性嫌疑则无法精准确定,因此这两种方法对可能的过度治疗并无明显改善。
[0006]蛋白质是生命活动的执行者,是生命表型的最终体现。定量蛋白质组学研究可从蛋白质组层面阐释某种生物现象的发生发展原因与规律,对生命科学以及人类自身疾病诊疗有重大意义。对于肿瘤组织和非肿瘤组织的定量蛋白质组研究,可能发现某种或某些肿瘤特异的蛋白质作为疾病的标志物,可用于肿瘤的早期诊断、确诊与分型。

技术实现思路

[0007]本专利技术涉及一种新型检测方法——基于靶向检测蛋白(多肽)与机器学习对甲状腺结节恶性程度评估的方法。
[0008]在一个方面,本专利技术提供一种基于靶向检测蛋白或多肽与机器学习对受试者的甲状腺结节恶性程度或恶性概率进行评估的非诊断方法,包括:a)提供受试者的细针穿刺组织活检即FNA样本;
b)采用压力循环技术(Pressure Cycling Technology, PCT)对样本进行前处理;c)检测所得到的样本中目标蛋白或多肽的蛋白质组学数据,其中所述目标蛋白或多肽包括选自表1的蛋白或多肽,并且所述蛋白质组学数据通过高效液相色谱方法和质谱方法获得;d)分析所得到的蛋白质组学数据,其中所述分析包括将所得到的蛋白质组学数据输入AI模型;以及e)输出结果,其中对于临床上不确定或者难以评判的甲状腺结节,提供恶性概率结果,其中所述蛋白质组学数据包括MRM离子对和峰面积。
[0009]本专利技术所涉及的质谱多反应监测(Multiple Reaction Monitoring,MRM)技术即质谱MRM技术,是一种基于已知信息或假定信息有针对性地获取数据从而进行质谱信号采集的技术。对于MRM技术而言关键在于首先要能够检测到具有特异性的母离子,然后只将选定的特异性母离子进行碰撞诱导(collision

induced),最后去除其他子离子的干扰,只对选定的特异子离子进行质谱信号的采集。由于三重四级杆质谱(triple quadrupole system, TQS)是进行单一质荷比扫描最灵敏的质谱系统,因此是最适合MRM分析的质谱仪器。
[0010]MRM技术能够在三重四级杆第一极(Q1)和第三极(Q3)中分别选择检测特定母离子和子离子,在母离子和子离子两个水平排除干扰,增强检测特异性。因此,本专利技术还涉及相应蛋白或多肽的母子离子对。
[0011]本专利技术所涉及的保留时间是指肽段通过色谱柱后出峰的时间。
[0012]本专利技术所涉及的碰撞电压是指母离子在质谱碰撞室中发生碎裂时的电压。
[0013]本专利技术所涉及的峰面积是指母子离子对色谱峰面积。
[0014]在一个实施方案中,该实施方案的评估方法中的d)步骤的分析包括建立AI模型,所述建立AI模型包括将回顾性数据集分为训练集、验证集和独立测试集,其中对于每个提供样本的单位,如果该单位的送样批次M≥2,则从该M批数据中随机选出一个批次的数据划分至独立测试集,而剩余M

1个批次的数据划分至训练集和验证集;任选地,其中建立AI模型还包括将划分至训练集和验证集的数据根据质谱产生的时间顺序划分为约70%的训练集和约30%的验证集;进一步任选地,其中建立AI模型还包括将前瞻性数据集作为第二独立测试集,该前瞻性数据集的样本批次和质谱时间均严格独立于回顾性数据集。
[0015]在另一个实施方案中,该实施方案的评估方法中的建立AI模型还包括计算样本中三种噪声蛋白HBB、THYG和H4的单个蛋白峰面积占总蛋白峰面积和以及这三种蛋白峰面积和占总蛋白峰面积和的比例,其中当单个蛋白的比例>70%或这三种蛋白峰面积和的比例>95%时,确定该样本为不合格样本;任选地,其中建立的AI模型,还包括使用了去除包含极高峰度的蛋白或多肽的样本,其中去除的蛋白或多肽包括VNVDEVGGEALGR、EFTPPVQAAYQK、LALQFTTNPK、LAAQSTLSFYQR、LEDIPVASLPDLHDIER、FLQGDHFGTSPR、QVDQFLGVPYAAPPLAERR、GGADVASIHLLTAR、RISGLIYEETR、ISGLIYEETR和VFLENVIR。
[0016]在又一个实施方案中,该实施方案的评估方法中的质谱方法包括将从色谱柱流出
的蛋白或多肽在三重四级杆质谱仪上使用正离子模式下的Scheduled MRM

模式进行数据采集,任选地Schedule窗口为2.5分钟。
[0017]在另一个方面,本专利技术提供目标蛋白或多肽作为检测靶标在制备试剂盒中的用途,所述试剂盒用于基于靶向检测蛋白或多肽与机器学习对受试者的甲状腺结节恶性程度或恶性概率进行评估,其中所述试剂盒包含检测目标蛋白或多肽的工具,并且其中所述目标蛋白或多肽包括选自表1的蛋白或多肽。
[0018]在一个实施方案中,该实施方案的用途所涉及的评估包括:a)提供受试者的细针穿刺组织活检即FNA样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种系统,其用于基于靶向检测蛋白或多肽与机器学习对受试者的甲状腺结节恶性程度或恶性概率进行评估,所述系统包含:i)采集装置,其采集受试者的细针穿刺组织活检即FNA样本;ii)样本前处理装置,其采用压力循环技术即PCT技术对样本进行前处理;iii)检测装置,其检测所得到的样本中目标蛋白或多肽的蛋白质组学数据,其中所述目标蛋白或多肽包括选自表1的蛋白或多肽,并且所述蛋白质组学数据通过高效液相色谱方法和质谱方法获得;iv)分析装置,其分析所得到的蛋白质组学数据,其中所述分析包括将所得到的蛋白质组学数据输入AI模型;以及v)输出装置,其输出结果,其中对于临床上不确定或者难以评判的甲状腺结节,提供恶性概率结果,其中所述蛋白质组学数据包括母子离子对、保留时间、碰撞电压(CE)和峰面积。2.根据权利要求1所述的系统,其中iv)的分析包括建立AI模型,所述建立AI模型包括将回顾性数据集分为训练集、验证集和独立测试集,其中对于每个提供样本的单位,如果该单位的送样批次M≥2,则从该M批数据中随机选出一个批次的数据划分至独立测试集,而剩余M

1个批次的数据划分至训练集和验证集;任选地,其中建立AI模型还包括将划分至训练集和验证集的数据根据质谱产生的时间顺序划分为约70%的训练集和约30%的验证集;进一步任选地,其中建立AI模型还包括将前瞻性数据集作为第二独立测试集,该前瞻性数据集的样本批次和质谱时间均严格独立于回顾性数据集。3.根据权利要求1或2所述的系统,其中建立AI模型还包括计算样本中三种噪声蛋白HBB、THYG和H4的单个蛋白峰面积占总蛋白峰面积和以及这三种蛋白峰面积和占总蛋白峰面积和的比例,其中当单个蛋白的比例>70%或这三种蛋白峰面积和的比例>95%时,确定该样本为不合格样本;任选地,其中建立AI模型还包括去除包含极高峰度的蛋白或多肽的样本,其中去除的蛋白或多肽包括VNVDEVGGEALGR、EFTPPVQAAYQK、LALQFTTNPK、LAAQSTLSFYQR、LEDIPVASLPDLHDIER、FLQGDHFGTSPR、QVDQFLGVPYAAPPLAERR、GGADVASIHLLTAR、RISGLIYEETR、ISGLIYEETR和VFLENVIR。4.根据权利要求1或2所述的系统,其中质谱方法包括将从色谱柱流出的蛋白或多肽在三重四极杆质谱仪上使用正离子模式下的Scheduled MRM
TM
模式进行数据采集,任选地Schedule窗口为2.5分钟。5.一种对受试者的甲状腺结节恶性程度或恶性概率进行评估的评估模型,其中通过将具有甲状腺结节不同恶性程度的受试者的细针穿刺组织活检即FNA样本的目标蛋白或多肽的蛋白质组学数据作为训练数据训练机器学习模型而得到该评估模型,其中所述目标蛋白或多肽包括选自表1的蛋白或多肽,并且其中对于临床上不确定或者难以评判的甲状腺结节,提供恶性概率结果,其中所述蛋白质组学数据包括母子离子对、保留时间、碰撞电压(CE)和峰面积。6.根据权利要求5所述的评估模型,其中评估包括建立AI模型,所述建立AI模型包括将回顾性数据集分为训练集、验证集和独立测试集,其中对于每个提供样本的单位,如果该单
位的送样批次M≥2,则从该M批数据中随机选出一个批次的数据划分至独立测试集,而剩余M

1个批次的数据划分至训练集和验证集;任选地,其中建立AI模型还包括将划分至训练集和验证集的数据根据质谱产生的时间顺序划分为约70%的训练集和约30%的验证集;进一步任选地,其中建立AI模型还包括将前瞻性数据集作为第二独立测试集,该前瞻性数据集的样本批次和质谱时间均严格独立于回顾性数据集。7.根据权利要求5或6所述的评估模型,其中建...

【专利技术属性】
技术研发人员:郭天南朱怡孙耀庭陈晨葛伟刚胡一凡许路昂
申请(专利权)人:西湖欧米杭州生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1