【技术实现步骤摘要】
评估甲状腺结节恶性程度或概率的系统、模型及试剂盒
[0001]本专利技术涉及医学检测领域,并具体涉及一种基于靶向检测蛋白或多肽与机器学习对甲状腺结节恶性程度评估的方法。
技术介绍
[0002]甲状腺结节(Thyroid Nodules)是一种常见的临床病症,根据尸检报告显示,甲状腺结节在普通人群中发病率约50%至60%,多发于女性人群。绝大多数甲状腺结节患者没有临床症状,常常是通过体检或自身触摸发现。在通过病理检查发现的甲状腺结节中,只有5%至15%的结节为恶性结节,即甲状腺癌。
[0003]目前临床指南推荐的甲状腺结节的评估主要基于以下三点:一是高分辨率的超声探查,二是血生化指标,三是细针穿刺组织活检(Fine needle aspiration biopsy, FNAB或FNA)。在以上三种检查中,FNA被认为是对可疑甲状腺结节患者的临床管理中最敏感、最经济的可靠检测方法。然而,FNA结果符合率的高与低通常需要取决于穿刺操作者、细胞病理医生的技术和经验,并且仍有15%至30%的甲状腺结节不能通过FNA和细胞病理学得到清楚地评估。针对不确定性甲状腺结节的处理方式,主流观点是进行甲状腺全切或近半切。但大多数术后病理证实为良性结节,这显然会导致过度诊断和过度治疗。
[0004]因此目前临床上的诊断标准和治疗方案对无症状的甲状腺结节患者并无益处。患者将支付高昂的手术费用以及甲状腺切除后需终身服用替代激素,甚至承担手术可能会带来的甲状腺危象及术后复发等风险。
[0005]近年来,随着分子技术的发展, ...
【技术保护点】
【技术特征摘要】
1.一种系统,其用于基于靶向检测蛋白或多肽与机器学习对受试者的甲状腺结节恶性程度或恶性概率进行评估,所述系统包含:i)采集装置,其采集受试者的细针穿刺组织活检即FNA样本;ii)样本前处理装置,其采用压力循环技术即PCT技术对样本进行前处理;iii)检测装置,其检测所得到的样本中目标蛋白或多肽的蛋白质组学数据,其中所述目标蛋白或多肽包括选自表1的蛋白或多肽,并且所述蛋白质组学数据通过高效液相色谱方法和质谱方法获得;iv)分析装置,其分析所得到的蛋白质组学数据,其中所述分析包括将所得到的蛋白质组学数据输入AI模型;以及v)输出装置,其输出结果,其中对于临床上不确定或者难以评判的甲状腺结节,提供恶性概率结果,其中所述蛋白质组学数据包括母子离子对、保留时间、碰撞电压(CE)和峰面积。2.根据权利要求1所述的系统,其中iv)的分析包括建立AI模型,所述建立AI模型包括将回顾性数据集分为训练集、验证集和独立测试集,其中对于每个提供样本的单位,如果该单位的送样批次M≥2,则从该M批数据中随机选出一个批次的数据划分至独立测试集,而剩余M
‑
1个批次的数据划分至训练集和验证集;任选地,其中建立AI模型还包括将划分至训练集和验证集的数据根据质谱产生的时间顺序划分为约70%的训练集和约30%的验证集;进一步任选地,其中建立AI模型还包括将前瞻性数据集作为第二独立测试集,该前瞻性数据集的样本批次和质谱时间均严格独立于回顾性数据集。3.根据权利要求1或2所述的系统,其中建立AI模型还包括计算样本中三种噪声蛋白HBB、THYG和H4的单个蛋白峰面积占总蛋白峰面积和以及这三种蛋白峰面积和占总蛋白峰面积和的比例,其中当单个蛋白的比例>70%或这三种蛋白峰面积和的比例>95%时,确定该样本为不合格样本;任选地,其中建立AI模型还包括去除包含极高峰度的蛋白或多肽的样本,其中去除的蛋白或多肽包括VNVDEVGGEALGR、EFTPPVQAAYQK、LALQFTTNPK、LAAQSTLSFYQR、LEDIPVASLPDLHDIER、FLQGDHFGTSPR、QVDQFLGVPYAAPPLAERR、GGADVASIHLLTAR、RISGLIYEETR、ISGLIYEETR和VFLENVIR。4.根据权利要求1或2所述的系统,其中质谱方法包括将从色谱柱流出的蛋白或多肽在三重四极杆质谱仪上使用正离子模式下的Scheduled MRM
TM
模式进行数据采集,任选地Schedule窗口为2.5分钟。5.一种对受试者的甲状腺结节恶性程度或恶性概率进行评估的评估模型,其中通过将具有甲状腺结节不同恶性程度的受试者的细针穿刺组织活检即FNA样本的目标蛋白或多肽的蛋白质组学数据作为训练数据训练机器学习模型而得到该评估模型,其中所述目标蛋白或多肽包括选自表1的蛋白或多肽,并且其中对于临床上不确定或者难以评判的甲状腺结节,提供恶性概率结果,其中所述蛋白质组学数据包括母子离子对、保留时间、碰撞电压(CE)和峰面积。6.根据权利要求5所述的评估模型,其中评估包括建立AI模型,所述建立AI模型包括将回顾性数据集分为训练集、验证集和独立测试集,其中对于每个提供样本的单位,如果该单
位的送样批次M≥2,则从该M批数据中随机选出一个批次的数据划分至独立测试集,而剩余M
‑
1个批次的数据划分至训练集和验证集;任选地,其中建立AI模型还包括将划分至训练集和验证集的数据根据质谱产生的时间顺序划分为约70%的训练集和约30%的验证集;进一步任选地,其中建立AI模型还包括将前瞻性数据集作为第二独立测试集,该前瞻性数据集的样本批次和质谱时间均严格独立于回顾性数据集。7.根据权利要求5或6所述的评估模型,其中建...
【专利技术属性】
技术研发人员:郭天南,朱怡,孙耀庭,陈晨,葛伟刚,胡一凡,许路昂,
申请(专利权)人:西湖欧米杭州生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。