一种对甲状腺微小乳头状癌进行分子分型的方法以及分子标志物应用技术

技术编号:37161865 阅读:18 留言:0更新日期:2023-04-06 22:27
本发明专利技术涉及一种甲状腺微小乳头状癌新分型的筛选方法,并公开一组基因集合作为生物标志物在甲状腺微小乳头状癌免疫治疗中的应用。本发明专利技术首先运用无监督聚类分析方法对转录组测序数据进行分析,得到了一个免疫激活且对干扰素γ敏感的炎症亚型,其相对于另一个亚型,表现为PD1、PDL1、CALT4的高表达以及CD

【技术实现步骤摘要】
一种对甲状腺微小乳头状癌进行分子分型的方法以及分子标志物应用


[0001]本专利技术涉及精准医疗
,具体地,涉及一种对甲状腺微小乳头状癌进行分子分型的方法以及分子标志物应用。

技术介绍

[0002]甲状腺微小乳头状癌是指最大径小于等于10mm的甲状腺乳头状癌,近年来甲状腺癌发病率的急剧上升主要是因为甲状腺微小乳头状癌的检出。2015年, ATA指南建议对低危的甲状腺微小乳头状癌进行随访以避免不必要的手术,但部分患者会出现淋巴结甚至远处转移,导致大部分临床医生和患者并不主张进行随访。因此,对甲状腺微小乳头状癌患者的处理现阶段仍存在挑战。
[0003]甲状腺微小乳头状癌是一种受环境和基因影响的多因素疾病,目前已知的主要因素包括电离辐射暴露、肥胖、基因以及表观遗传学的变异等。目前发现的 BRAF、RAS、RET等基因主要聚焦于甲状腺乳头状癌,单独以甲状腺微小乳头状癌作为研究对象的研究极少,尚不足以较为完整地揭示甲状腺微小乳头状癌发生发展等病理生理过程。此外,免疫治疗近年来在临床上受到越来越多的关注,在甲状腺乳头状癌中也有所进展。有研究对晚期甲状腺乳头状癌患者进行了帕博丽珠单抗治疗,部分患者治疗效果令人欣喜,但这些患者占比并不大,这可能是患者的免疫异质性造成的,需要更多的分子标志物来筛选对免疫治疗敏感的患者。

技术实现思路

[0004]本专利技术克服了现有技术的不足,提供了一种甲状腺微小乳头状癌分型的分类方法和分子标志物应用。
[0005]为了达到上述目的,本专利技术采用的技术方案为:<br/>[0006]一种对甲状腺微小乳头状癌进行分子分型的方法,包括以下步骤:
[0007]S1数据获取:对甲状腺微小乳头状癌组织进行全转录组测序,得到甲状腺微小乳头状癌基因表达数据集,下载28例甲状腺微小乳头状癌患者的临床数据和转录组数据,下载58例正常甲状腺组织的转录组数据;
[0008]S2分子分型:通过无监督聚类算法进行分子分型,根据轮廓分数确定最佳分类为2,通过差异分析,得到每个亚型的特征基因;
[0009]S3分型定义:对每个亚型的特征基因进行通路富集分析,根据其功能将两种亚型定义为炎症型和侵袭型;
[0010]S4免疫评估:利用不同免疫相关基因集进行单样本富集分析来评估两种亚型的免疫状态,并采用反卷积法对两种亚型的免疫细胞浸润丰度进行评估,最后对免疫检查点治疗相关基因的表达情况进行分析来评估两种亚型对免疫检查点治疗的敏感性;
[0011]S5模型构建:利用LASSO筛选得到符合预设条件的关键基因,构建分型预测模型;
[0012]S6模型评估:利用ROC曲线和AUC值评估模型的预测能力,并根据约登指数确定分类最佳截断值;
[0013]S7模型验证:将待分类的甲状腺微小乳头状癌患者数据输入S5构建的模型中,鉴别待分类患者的亚型种类并再次通过免疫评估步骤评估分类的准确性,最后通过生存分析评估不同亚型的生存状态。
[0014]在本专利技术的一个较佳实施例中,进一步包括,在S2中,分型的过程中采用的数据通过R语言DESeq2包标准化并进行对数转换,方法是R语言SC3包,所用基因为标准差排序前5000个基因,每个亚型的特征基因定义为校正P值小于0.05。
[0015]在本专利技术的一个较佳实施例中,进一步包括,在S3中,分型定义的过程中采用的是R语言clusterprofiler包,所用基因为每个亚型的特征基因,采用默认的参数,以校正P值小于0.05作为其显著通路的截断值。
[0016]在本专利技术的一个较佳实施例中,进一步包括,在S4中,免疫评估的过程中采用R语言ESTIMATE包、immunedeconv包、GSVA包,并采用秩和检验对比两种亚型免疫特征得分和免疫相关基因的表达量,以P值小于0.05作为两组具有统计学显著差异的截断值。
[0017]在本专利技术的一个较佳实施例中,进一步包括,在S5中,两个数据集经过标准化和对数转换后的基因表达量采用R语言sva包进行批次效应的去除,然后将所有亚型的特征基因的经过处理的表达量纳入LASSO回归分析,通过R语言glmnet包选择系数不为0的基因构建筛选模型并计算诊断风险得分;
[0018]其中公式为:风险得分=28.09977752

0.98758679*CCNI

1.53712485*PGRMC2

0.52919630*SYNPO

0.43810986*RAB27A

1.00260392*RASA1

0.06439753*LAMC1

0.28431350*EHD2+0.16597787*IGKV4

1+0.34026915*IGKV1D

39+0.10677938*IGKV3

11+0.58545336*IGHV3

21+0.16645968*IGHV3

30+0.41399296*ST6GAL1+0.68858130*CXCR4+0.17401608*RGS1+0.37281935*OAS2+0.03731571*IFI44L。
[0019]在本专利技术的一个较佳实施例中,进一步包括,S6中,依据S5风险评分公式计算各患者的风险评分,并利用R语言predict函数预测患者为炎症型的概率,然后使用ROC曲线分析以评估模型的预测能力,最后通过约登指数来确定分类最佳截断值,最佳截断值为0.494。
[0020]在本专利技术的一个较佳实施例中,进一步包括,S7中,将待分类的甲状腺微小乳头状癌患者的处理过的基因表达量输入所述模型计算每个患者的得分,并根据最佳截断值将其分为炎症型和非炎症型,然后对两组进行免疫评估,其采用的是R语言ESTIMATE包、immunedeconv包、GSVA包,并采用秩和检验对比两组免疫特征得分和免疫相关基因的表达量,以P值小于0.05作为两组具有统计学显著差异的截断值,然后采用R语言survival包对两组患者无进展生存进行分析,计算两组的5年无进展生存率。
[0021]在本专利技术的一个较佳实施例中,进一步包括,一组用于筛选甲状腺微小乳头状癌炎症亚型的分子标志物,其特征在于,所述分子标志物包括:AFP突变、IGH@ext融合、TG融合、TPTE2融合、IFRD1融合;
[0022]所述分子标志物按照如下方法对甲状腺微小乳头状癌免疫亚型进行筛选:S101数据获取:对甲状腺微小乳头状癌患者癌和癌旁组织进行全外显子组测序和全转录组测序,得到甲状腺微小乳头状癌体细胞突变数据集和基因融合数据集;S102驱动基因筛选:采用MutSigCV算法选择显著突变的基因作为驱动突变基因,并采用STAR

Fusion流程选择可
信度高的融合基因并采用RT

PCR对其进行验证; S103炎症亚型分子标志物确定:对驱动基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对甲状腺微小乳头状癌进行分子分型的方法,其特征在于,包括以下步骤:S1数据获取:对甲状腺微小乳头状癌组织进行全转录组测序,得到甲状腺微小乳头状癌基因表达数据集,下载28例甲状腺微小乳头状癌患者的临床数据和转录组数据,下载58例正常甲状腺组织的转录组数据;S2分子分型:通过无监督聚类算法进行分子分型,根据轮廓分数确定最佳分类为2,通过差异分析,得到每个亚型的特征基因;S3分型定义:对每个亚型的特征基因进行通路富集分析,根据其功能将两种亚型定义为炎症型和侵袭型;S4免疫评估:利用不同免疫相关基因集进行单样本富集分析来评估两种亚型的免疫状态,并采用反卷积法对两种亚型的免疫细胞浸润丰度进行评估,最后对免疫检查点治疗相关基因的表达情况进行分析来评估两种亚型对免疫检查点治疗的敏感性;S5模型构建:利用LASSO筛选得到符合预设条件的关键基因,构建分型预测模型;S6模型评估:利用ROC曲线和AUC值评估模型的预测能力,并根据约登指数确定分类最佳截断值;S7模型验证:将待分类的甲状腺微小乳头状癌患者数据输入S5构建的模型中,鉴别待分类患者的亚型种类并再次通过免疫评估步骤评估分类的准确性,最后通过生存分析评估不同亚型的生存状态。2.根据权利要求1所述的对甲状腺微小乳头状癌进行分子分型的方法,其特征在于,在S2中,分型的过程中采用的数据通过R语言DESeq2包标准化并进行对数转换,方法是R语言SC3包,所用基因为标准差排序前5000个基因,每个亚型的特征基因定义为校正P值小于0.05。3.根据权利要求1所述的对甲状腺微小乳头状癌进行分子分型的方法,其特征在于,在S3中,分型定义的过程中采用的是R语言clusterprofiler包,所用基因为每个亚型的特征基因,采用默认的参数,以校正P值小于0.05作为其显著通路的截断值。4.根据权利要求1所述的对甲状腺微小乳头状癌进行分子分型的方法,其特征在于,在S4中,免疫评估的过程中采用R语言ESTIMATE包、immunedeconv包、GSVA包,并采用秩和检验对比两种亚型免疫特征得分和免疫相关基因的表达量,以P值小于0.05作为两组具有统计学显著差异的截断值。5.根据权利要求1所述的对甲状腺微小乳头状癌进行分子分型的方法,其特征在于,在S5中,两个数据集经过标准化和对数转换后的基因表达量采用R语言sva包进行批次效应的去除,然后将所有亚型的特征基因的经过处理的表达量纳入LASSO回归分析,通过R语言glmnet包选择系数不为0的基因构建筛选模型并计算诊断风险得分;其中公式为:风险得分=28.09977752

0.98758679*CCNI

1.53712485*PGRMC2

0.52919630*SYNPO

0.43810986*RAB27A

1.00260392*RASA1

0.06439753*LAMC1

0.28431350*EHD2+0.16597787*IGKV4

1+0.34026915*IGKV1D

39+0.10677938*IGKV3

【专利技术属性】
技术研发人员:钱碧云朱滕滕李蔷冯铁男
申请(专利权)人:上海市同仁医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1