一种HLA基因分型方法、装置和存储介质制造方法及图纸

技术编号:29935896 阅读:27 留言:0更新日期:2021-09-04 19:12
本申请公开了一种HLA基因分型方法、装置以及存储介质,方法包括:HLA预测分型获取步骤、HLA分型标记步骤、HLA分型整合步骤。本申请HLA基因分型方法,通过对不同基因分型工具获得的HLA预测分型进行权重分值的标记,对不同基因分型工具获得的HLA预测分型按照权重分值进行整合,能够充分利用每个基因分型工具的检测优势,减少由于测序深度等因素带来的某些基因分型工具准确率不高等问题,从而提高了HLA分型的准确率。分型的准确率。分型的准确率。

【技术实现步骤摘要】
一种HLA基因分型方法、装置和存储介质


[0001]本申请涉及生物信息学
,具体涉及一种HLA基因分型方法、装置和存储介质。

技术介绍

[0002]人类白细胞抗原(HLA)复合物位于第6号染色体(6q21.31)短臂的3.6Mbp延伸范围内,可以编码人类主要组织相容性复合物(MHC)蛋白。HLA主要分两类:HLA

I类基因编码MHC I类蛋白,它们存在于除红细胞外的所有细胞内,专注于识别细胞内因为病毒侵染、基因变异等原因而产生的抗原,并将抗原转运到细胞表面。当毒性T细胞与产生了抗原的细胞接触时,会识别到抗原并清除该细胞;HLA

II类基因编码MHC 2类蛋白,它们存在于抗原呈递细胞中并且能识别细胞内和细胞外的的抗原,最终通过CD
4+
辅助T细胞刺激B细胞产生抗体。
[0003]HLA是具有高度多态性的同种异体抗原,其化学本质为一类糖蛋白,由一条α重链(被糖基化的)和一条β轻链非共价结合而成。其肽链的氨基端向外(约占整个分子的3/4),羧基端穿入细胞质,中间疏水部分在胞膜中。HLAⅠ类抗原的特异性取决于α重链,由HLA

A、HLA

B、HLA

C三个位点编码。
[0004]近年来,癌症免疫疗法已取得重大突破,并成为泛癌患者中使用最广泛的治疗方法之一。最近的研究表明,与HLA

I类分子相关的肿瘤特异性细胞内抗原(新生抗原)和新抗原特异性T细胞应答的呈递对于激活癌症免疫疗法中的适应性免疫系统至关重要。值得注意的是,由于HLA单倍型缺失,特定抗原呈递机制基因的向下转录表达以及肿瘤微环境的变化而导致的HLA基因下调,可能会降低在许多癌症类型中呈递新抗原的能力并促进免疫逃逸。此外,研究还表明了HLA

Ia基因型(如HLA

B44和HLA

B62)和杂合性(LOH)状态的丧失已被证明与患者的预后和免疫疗法的疗效有关。不仅于此,先前的研究还发现,分别在8.1%和3.3%的大肠癌和黑色素瘤患者中检测到HLA体细胞突变,这可能会影响预测准确性。因此,准确的HLA

I类等位基因分型对于免疫疗法的临床应用非常重要。
[0005]HLA等位基因可以通过血清学表型或DNA分子分析进行分型。尽管通过血清学分型的HLA可以在很短的时间内得出低精度的分型结果,但它无法识别罕见或新的HLA等位基因。
[0006]当前,聚合酶链反应(PCR)是使用最广泛的HLA分型方法,并且可以进一步分为聚合酶链反应序列特异性引物(PCR

SSP),聚合酶链反应序列特异性寡核苷酸探针(PCR

SSO)和聚合酶链反应测序基础分型(PCR

SBT)。由于PCR

SSP和PCR

SSO技术只能扩增指定区域,导致其HLA分型的分辨率不高。PCR

SBT的技术由于其使用到了一代或三代测序技术,因此得到了高分辨率的HLA等位基因分型,但也导致检测成本和时间大幅增加。
[0007]随着二代测序技术的迅速发展,研究与临床应用中开始使用生物信息学工具基于二代测序数据进行HLA分型。这些工具主要是基于比对或组装的方法。其中,基于比对的方法准确率较高,被广泛使用,最有代表性的是OptiType,Phlat,Polysolver这三个工具。这些方法通过将测序reads与参考HLA序列进行比较,并使用概率模型进行HLA分型。
[0008]基于二代测序数据的HLA分型方法可以检测传统扩增的PCR区域之外的杂合等位基因和多态性,与基于血清学的方法相比,分辨率更高,可识别稀有的HLA亚型,与基于PCR的方法相比,其速度更快,成本更低。
[0009]但是,基于二代测序数据进行HLA分型仍然存在很多挑战,例如HLA序列的多态性,二代测序数据检测长度的局限性,在肿瘤患者中的HLA分型准确率未知等问题。

技术实现思路

[0010]本申请的目的是提供一种一种HLA基因分型方法、装置和存储介质,以提高现有HLA基因分型方法的准确率。
[0011]为了实现上述目的,本申请采用了以下技术方案:
[0012]本申请的第一方面公开了一种HLA基因分型方法,包括:
[0013]HLA预测分型获取步骤:获取待测样本的测序数据,采用不同的基因分型工具确定待测样本的HLA预测分型;
[0014]HLA分型标记步骤:对各基因分型工具获得的待测样本的HLA预测分型标记权重分值,其中,权重分值与各基因分型工具预测HLA分型的准确率呈正相关,即基因分型工具预测HLA分型的准确率越高,权重分值越大;
[0015]HLA分型整合步骤:根据权重分值对不同的基因分型工具得到的待测样本的HLA预测分型进行整合,得到待测样本的最终HLA分型。
[0016]值得说明的是,本申请通过对不同基因分型工具获得的HLA预测分型进行权重分值的标记,对不同基因分型工具获得的HLA预测分型按照权重分值进行整合,能够充分利用每个基因分型工具的检测优势,提高多样性区域的HLA基因分型准确性;其中,待测样本可以是单独的肿瘤样本,也可以是单独的对照样本,也可以既包含肿瘤样本也包含对照样本,并能够通过整合肿瘤样本和对照样本的分型结果,减少由于单个样本中HLA基因区域测序深度不足、HLA基因发生杂合性缺失等因素导致的分型不准确的问题,从而提高了HLA分型的准确率。
[0017]本申请的一种实现方式中,权重分值采用以下方法计算获得:
[0018]获取预设数量样本的测序数据,采用不同的基因分型工具确定各预设数量样本的HLA预测分型;
[0019]获取各预设数量样本的HLA验证分型,根据基因分型工具确定的各预设数量样本的HLA预测分型与相应的HLA验证分型的一致程度计算各基因分型工具获得的HLA预测分型的准确率;
[0020]将不同的基因分型工具获得的HLA预测分型的准确率分别乘以预设系数作为权重分值。
[0021]本申请的一种实现方式中,根据HLA验证分型计算各基因分型工具获得的HLA预测分型的准确率,具体包括:
[0022]分别统计每个基因分型工具获得的预设数量样本HLA预测分型与HLA验证分型一致的HLA基因数A1、HLA预测分型与HLA验证分型不一致的HLA基因数A2、HLA分型预测失败的基因数A3,计算A1、A2、A3之和;
[0023]将A1与A1、A2、A3之和的比值作为各基因分型工具获得的HLA预测分型的准确率。
[0024]本申请的一种实现方式中,预设数量样本的样本类型包括肿瘤样本和对照样本中的至少一组;
[0025]优选的,肿瘤样本来自于新鲜肿瘤组织、FFPE肿瘤组织或其他形态的肿瘤组织中的至少一种;
[0026]优选的,对照样本来自于癌旁组织、PBMC细胞或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种HLA基因分型方法,其特征在于,包括:HLA预测分型获取步骤:获取待测样本的测序数据,采用不同的基因分型工具确定待测样本的HLA预测分型;HLA分型标记步骤:对各基因分型工具获得的待测样本的HLA预测分型标记权重分值,其中,所述权重分值与各基因分型工具预测HLA分型的准确率呈正相关,即基因分型工具预测HLA分型的准确率越高,权重分值越大;HLA分型整合步骤:根据权重分值对不同的基因分型工具得到的待测样本的HLA预测分型进行整合,得到待测样本的最终HLA分型。2.根据权利要求1所述的HLA基因分型方法,其特征在于,所述权重分值采用以下方法计算获得:获取预设数量样本的测序数据,采用不同的基因分型工具确定各预设数量样本的HLA预测分型;获取各预设数量样本的HLA验证分型,根据基因分型工具确定的各预设数量样本的HLA预测分型与相应的HLA验证分型的一致程度计算各基因分型工具获得的HLA预测分型的准确率;将不同的基因分型工具获得的HLA预测分型的准确率分别乘以预设系数作为权重分值。3.根据权利要求2所述的HLA基因分型方法,其特征在于,所述根据HLA验证分型计算各基因分型工具获得的HLA预测分型的准确率,具体包括:分别统计每个基因分型工具获得的预设数量样本HLA预测分型与HLA验证分型一致的HLA基因数A1、HLA预测分型与HLA验证分型不一致的HLA基因数A2、HLA分型预测失败的基因数A3,计算A1、A2、A3之和;将A1与A1、A2、A3之和的比值作为各基因分型工具获得的HLA预测分型的准确率。4.根据权利要求3所述的HLA基因分型方法,其特征在于,所述预设数量样本的样本类型包括肿瘤样本和对照样本中的至少一组;优选的,所述肿瘤样本来自于新鲜肿瘤组织、FFPE肿瘤组织或其他形态的肿瘤组织中的至少一种;优选的,所述对照样本来自于癌旁组织、PBMC细胞或其他正常组织中的至少一种;优选的,所述基因分型工具包括OptiType、Polysolver、Phlat中的至少两种;优选的,所述...

【专利技术属性】
技术研发人员:易坚陈前兴王佳茜陈龙昀苏小凡
申请(专利权)人:深圳裕泰抗原科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1