一种基于全外显子组测序分析HPV病毒整合位点的方法技术

技术编号:36100469 阅读:65 留言:0更新日期:2022-12-28 13:59
本发明专利技术提供了一种检测HPV整合位点的试剂盒,属于基因工程技术领域。研究发现HPV整合情况与宫颈癌的发病进程呈现正相关,但由于HPV病毒整合宿主具有其独特性,在人类基因组中定点识别人乳头状瘤病毒DNA整合尤为困难。本发明专利技术旨在提供一套完整的高通量全外显子组分析宿主HPV整合的方法:1、DNA样本建库测序;2、质量控制:去除接头、引物、低质量reads序列;3、序列比对:与人类基因组和HPV基因组比对;4、PCR重复:去除非人类基因组中的reads;5、HPV整合位点判定:一条reads序列同时比对到人类基因组和HPV基因组。组和HPV基因组。

【技术实现步骤摘要】
一种基于全外显子组测序分析HPV病毒整合位点的方法


[0001]本专利技术属于分子生物学领域,涉及医学、生物技术和生物信息学,具体的是涉及一种高通量测序检测HPV整合位点的方法。

技术介绍

[0002]宫颈癌是全球女性最常见的妇科恶性肿瘤之一,据统计世界上每年宫颈癌新发患者约53万例,每年死亡约27万人。目前85%的宫颈癌病例发生在发展中国家,其中,中国每年新增发病病例超过13.7万,占全世界总数的28.8%。
[0003]研究表明,宫颈癌的形成是一个复杂且连续的发展过程,其发展历程可概括为:宫颈上皮内瘤样变(CIN

I)

CINII

CIN III

宫颈原位癌(CIS)

早期宫颈浸润癌

宫颈浸润癌(ICC)。可见,宫颈上皮癌前病变是宫颈癌的发病起始,而高危型人乳头瘤病毒HPV的持续性感染被证实是导致正常宫颈上皮细胞发生癌病的最主要因素。虽然HPV感染宿主后,既可以游离形式存在,也可整合到宿主基因组中,但大量研究表明宫颈癌的发生和发展总是伴随着HPV整合入宿主基因组的现象。因此,检测HPV整合宿主基因组可作为诊断宫颈癌的有效手段。
[0004]目前,关于HPV病毒整合入宿主基因组中的研究方法,最常见的是以样本mRNA为研究对象,基于PCR扩增技术拓展的各类方法,但RNA样本的保存与运输存在一定的难度,同时并不适用大样本的分析和研究。而高通量测序技术以能一次并行对几十万到几百万条DNA分子进行序列测定,大大提高了DNA的测序效率。其中,相同芯片通量下,全外显子组测序相较于全基因组来说,测序样本数更多,覆盖深度更高,成本更低,耗时更短。

技术实现思路

[0005]本专利技术的目的在于提供一种基于全外显子组测序来分析宿主HPV病毒整合位点的方法,来解决大样本HPV整合位点分析困难、费用昂贵、费时等问题。
[0006]本专利技术的方法,包括数据过滤、序列比对、确定整合位点等。
[0007]本专利技术基于高通量全基因组测序技术,根据匹配质量及Paired_end reads序列间的PE关系评估HPV病毒整合位点的准确性,以多层次水平的测序信息整合分析,最终实现病毒插入位点的精确定位,并进一步完善病毒整合分析的方法
[0008]宫颈癌组织样本和对应血液样本。
[0009]测序服务器为华大MGISEQ

2000RS FAST测序仪。
[0010]测序使用参考基因组为HgI9。
[0011]全外显测序panel为安捷伦v7

S31285117_hgs_19。
[0012]Reads测序质量报告分析软件FastQC(v0.11.8)。
[0013]质量过滤软件fastp(v0.21.0)。
[0014]构建参考基因组Hg19与HPV的索引软件Samtools。
[0015]序列比对参考基因组Hg19与HPV基因组。
[0016]序列比对软件BWA(v0.7.17)。
[0017]序列比对算法BWA

MEM。
[0018]Reads文件的压缩转换及排序软件Samtools。
[0019]使用Picard软件(v1.119)删除Reads中由PCR扩增产生的非样本基因组中的reads。
[0020]提取比对到HPV基因组上的reads,使用工具Samtools view。
[0021]通过BLASTn软件进行一步验证。
[0022]使用Excel表格统计HPV病毒整合位点。
附图说明
[0023]图1显示了利用Excel表格统计各样本在不同HPV基因组上的插入整合情况,并定位至HPV基因组上的基因,整合位点结果标记在人类基因组上。
具体实施例
[0024]下面结合具体实施方式进一步阐述本专利技术的技术方案。
[0025]样本准备:从不同阶段感染HPV病毒的患者体内取宫颈组织及对应血液样本,对宫颈组织制作石蜡切片与,共52对。
[0026]样本基因组DNA提取:使用商用试剂盒提取宫颈组织及血液样本中的DNA。文库构建:磁珠法提取试剂盒(MGIEasy,1000006988)进行DNA提取及纯化,Qubit3.0荧光定量仪(ThermoFisher,Q33216)进行核酸定量。若基因组DNA量足够,推荐使用200ng及以上基因组DNA(推荐浓度≥15ng/μL)进行文库构建,使用MGIEasy酶切DNA文库制备试剂盒(MGIEasy,V2.0)按照其说明书的表述进行构建文库。Bioanalyze(Agilent Technologies,G2939AA)检测DNA片段大小,文库片段主峰应该在430bp附近。Qubit3.0荧光定量仪(ThermoFisher,Q33216)进行文库核酸定量,依据文库浓度。将每12个文库等质量混合,形成一个混合文库,取混合文库1500

2000ng,使用Agilent SureSelect Human All Exon V7试剂盒捕获全外显子组区域片段,利用使用MGIEasy酶切DNA文库制备试剂盒(MGIEasy,V2.0)进行捕获文库的扩增(POST

PCR)、纯化后获得全外显子组文库。
[0027]高通量测序:将上述构建好的全外显子组文库按照每个lane(FCL芯片共有4个Iane)至少投入280ng文库的标准加入到FCL测序芯片中,将测序芯片放入华大MGISEQ

2000RS测序仪中,设置PE150的双端测序程序,利用测序服务器为华大MGISEQ

2000RS FAST测序仪进行测序。获得全外显子测序数据。
[0028]通过FastQC查看测序数据的质量信息,获取质量报告,判断样本测序是否合格,若不合格,则剔除该样本,避免对后续结果产生影响。
[0029]根据质量报告使用fastp软件(v0.20.0),删除质量Q20<90%的读数,通过强加读取映射的最低Phred质量得分(MapQ)来执行过滤,删除低映射质量(MapQ<5)的读数,去除接头及低于30bp的reads,并去除reads的5

端10bp的碱基(GC含量波动较大),完成数据的过滤。
[0030]在UNIVERSITy OF CALIFORNIA SANTA CRUZ(UCSC)中下载人类基因组Hg19的Fasta序列,以及在NCBI中下载已明确报道的18种高危型HPV(6,11,16,18,31,33,35,39,
45,52,56,58,59,66,68,69,82和83)病毒基因组构成混合病毒库HR

HPV。合并Hg19和HR

HPV成一个Fasta文件,使用Samtools index构建人类Hg19和HPV基因组索引。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测HPV病毒整合至宿主基因组的方法,其特征在于,包括提取样本DNA、构建文库、高通量测序、数据过滤、构建人类基因组和HPV基因组索引、构建序列比对索引、reads比对人类基因组并进行排序、质量控制、reads序列对比HPV基因组、确定嵌合型reads序列。2.如权利要求1所述的方法,其特征在于:所述样本为不同阶段感染HPV病毒患者的宫颈组织及对应血液,所述宫颈组织作石蜡切片处理。3.如权利要求1所述的方法,其特征在于:磁珠法提取试剂盒(MGIEasy,1000006988)进行DNA提取及纯化,Qubit3.0荧光定量仪(ThermoFisher,Q33216)进行核酸定量。若基因组DNA量足够,推荐使用200ng及以上基因组DNA(推荐浓度≥15ng/μL)进行文库构建,使用MGIEasy酶切DNA文库制备试剂盒(MGIEasy,V2.0)按照其说明书的表述进行构建文库。Bioanalyze(Agilent Technologies,G2939AA)检测DNA片段大小,文库片段主峰应该在430bp附近。Qubit3.0荧光定量仪(ThermoFisher,Q33216)进行文库核酸定量,依据文库浓度。将每12个文库等质量混合,形成一个混合文库,取混合文库1500

2000ng,使用Agilent SureSelect Human All Exon V7试剂盒捕获全外显子组区域片段,利用使用MGIEasy酶切DNA文库制备试剂盒(MGIEasy,V2.0)进行捕获文库的扩增(POST

PCR)、纯化后获得全外显子组文库。4.如权利要求1所述的方法,其特征在于:所述的高通量测序进行的是全外显子测序。5.如权利要求4所述的方法,将上述构建好的全外显子组文库按照每个lane(FCL芯片共有4个lane)至少投入280ng文库的标准加入到FCL测序芯片中,将测序芯片放入华大MGISEQ

2000RS测序仪中,设置PEI50的双端测序程序,利用测序服务器为华大MGISEQ

2000RS FAST测序仪进行测序。6.如权利要求1所述的方法,其特征在于:所述的数据过滤为通过FastQC查看高通量测序数据的质量信息,获得质量报告,剔除不合格数据所代表的样本,剔除数据过滤后样本在人类染色体基因组平均覆盖度低于30X的样本(数据过滤方法为:使用fastp软件(v0.20.0),删除质量Q20<90%的读数,通过强加读取映射的最低Phred质量得分(MapQ)来执行过滤,删除低映射质量(MapQ<5)的读数,去除接头及低于30bp的reads,...

【专利技术属性】
技术研发人员:玛依努尔
申请(专利权)人:新疆维吾尔自治区人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1