混样筛选潜在风险单核苷酸多态性等位位点的方法技术

技术编号:34923742 阅读:24 留言:0更新日期:2022-09-15 07:16
本发明专利技术提供了一种混样筛选潜在风险单核苷酸多态性等位位点的方法,所述构建方法包括:分别将疾病组和正常组每个人的核酸样品等量混样,获得疾病组样品和正常组样品;分别以所述样品为模板,对关注的易感基因的外显子全长进行PCR,获得扩增产物并测序,获得疾病组和正常组测序数据;通过质量筛选后,与基因组参考序列进行对比并分析,获得SNP位点的测序片段和每个所述测序片段的支持数;对每个所述SNP位点进行注释,统计正常组和疾病组中每个SNP位点中每种等位基因出现的频率;通过比较疾病组中和正常组所述频率,筛选疾病组相对正常组显著差异的SNP位点,获得潜在风险SNP位点。该方法减少了成本的投入且简单方便,且灵敏准确。敏准确。敏准确。

【技术实现步骤摘要】
混样筛选潜在风险单核苷酸多态性等位位点的方法


[0001]本专利技术属于生物
,涉及一种混样筛选潜在风险单核苷酸多态性等位位点的方法。

技术介绍

[0002]单核苷酸多态性(Single Nucleotide Polymorphism,简称SNP)是指DNA序列上发生的单个核苷酸碱基之间的变异,在人群中这种变异的发生频率至少大于1%,它是基因组中存在的一种数量非常丰富的变异形式,占人类基因组中遗传多态性的90%以上。针对不同人种基因组的测序结果表明,在人类群体中存在大约1000万个SNP位点,在公共数据库中至少有500多万个SNPs已被报道,SNPs在基因组的分布密度达到每300

500个碱基就存在一个SNP。随着分子生物学技术的飞跃发展,SNPs基因分型技术和方法不断涌现。虽然经典的一些检测SNPs的技术,如限制性片段长度多态性(restriction fragment length polymorphism,RFLP)和单链构象多态性(single

strand conformation polymorphism,SSCP)等技术仍在实践中广泛使用,但一些高灵敏度、高通量的基因分型方法日益受到重视。这些检测技术包括:TaqMan探针法、SNPlex基因分型法、连接酶检测反应法(ligase detection reaction,LDR)、焦磷酸测序法、DNA芯片/阵列分析法、微球法(Illumina),以及质谱分析和温控高效液相色谱法,可以满足大样本及多SNPs位点的基因分型要求。
[0003]随着SNPs检测技术的进展,SNPs在人群中的检测日益得到广泛应用,特别是对于当前多基因复杂疾病如肿瘤、冠心病的遗传易感性的探讨,传统的以家系为基础的连锁分析在检测能力上已经有了明显的局限性,而病例

对照等易于开展的关联性研究方法有显著的优势。因此,近几年探讨SNPs作为复杂性疾病的遗传标记的关联性研究大量涌现。
[0004]而基于SNPs关联研究到学上,需要大量的样本,目前主要是收集大量样本,然后对每个样本进行全基因组或者全外显子组测序,最后进行关联分析,这样就要对计算机的计算和存储能力要求很高,而且对分析复杂性也有极大的提升,还要付出的巨大的财力,基于以上几点的要求就很难以让一般的科研人员或者临床数据难以得到应用,不宜于普遍的推广。
[0005]因此,有必要开发一种减少了成本的投入且简单方便的混样筛选潜在风险单核苷酸多态性等位位点的方法。

技术实现思路

[0006]为了解决所述技术问题,本专利技术提供了一种混样筛选潜在风险单核苷酸多态性等位位点的方法,该方法减少了成本的投入,降低对设备的要求,降低实验费用成本,简单方便。
[0007]为解决上述技术问题,本专利技术采用如下技术方案:
[0008]本专利技术提供了一种混样筛选潜在风险单核苷酸多态性等位位点的方法,所述方法包括:
[0009]将样本的核酸样品分为疾病组和正常组分别等量混样,获得疾病组样品和正常组样品;分别以所述疾病组样品和正常组样品为模板,对关注的易感基因的外显子全长进行PCR,获得扩增产物并测序,获得疾病组和正常组测序数据;
[0010]将所述疾病组和正常组测序数据分别通过质量筛选后,与基因组参考序列进行对比并分析,获得所有SNP位点、对应每个SNP位点的测序片段、和每个所述测序片段的支持数;
[0011]对每个所述SNP位点进行注释,统计正常组和疾病组中每个SNP位点中每种等位基因出现的频率;
[0012]通过比较疾病组中和正常组中每个SNP位点中每种等位基因出现的频率之差,筛选疾病组相对正常组显著差异的SNP位点,获得潜在风险SNP位点。
[0013]进一步地,所述疾病组样品中包含多种含有等量核酸样品的疾病样本;所述正常组样品中包含多种含有等量核酸样品的正常样本;所述疾病组样品与所述正常组样品的样品数相等或不相等。
[0014]进一步地,所述关注的易感基因包括五个,分别为PARK2、PINK1、Vps35、EIF4G1、LRRK2,对关注的易感基因的外显子全长进行PCR时采用的引物对分别如SEQ ID NO.1

SEQ ID NO.2所示、SEQ ID NO.3

SEQ ID NO.4所示、SEQ ID NO.5

SEQ ID NO.6所示、SEQ ID NO.7

SEQ ID NO.8所示、SEQ ID NO.9

SEQ ID NO.10所示。
[0015]具体地:
[0016]PINK1(F:5`

CGTGGGTCCAAAGTGC

3`;R:5`

ACAAATGGGAGGTGCTG

3`)、
[0017]LRRK2(F:5`

AGGAAGCCGAGCAGGAG

3`;R:5`

AAGGAAAGGATATGGGAGT

3`)、
[0018]Vps35(F:5`

AAACACGAAAGAGCCACG

3`;R:5`

TAATTCACTTACCGCATC

3`)、
[0019]EIF4G1(F:5`

TGGGAGTTTCAAAGTTCGG

3`;R:5`

GGCGGCTTTACCTTCAGT

3`)、
[0020]PARK2(F:5`

CCGACGTACAGGGAACATAA

3`;
[0021]R:5`

TCAGACAGCATCTCCTTTAATCCTG

3`)。
[0022]进一步地,所述质量筛选包括:
[0023]使用cutadapt从原始测序片段序列中去掉adaptor,后使用FASTX Toolkit(v0.0.14)处理片段序列,去除末端低质量碱基并删除低质量片段序列,其中,所述末端低质量碱基为质量<20的碱基片段序列,所述低质量片段序列为质量<20的碱基占整个序列长度大于70%的片段序列;
[0024]截掉N碱基及N之后的碱基,使用BWA

MEM软件的默认参数将长度超过16nt的作为筛选后的高质量片段序列。
[0025]进一步地,所述与基因组参考序列进行对比并分析中,通过基因分析工具GATK分析,获得所有SNP位点。
[0026]进一步地,所述SNP位点注释包括:
[0027]针对每一个SNP位点,参考基因组的碱基类型为ref,其可能发生的多态性碱基位点为alt,分别统计支持碱基是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种混样筛选潜在风险单核苷酸多态性等位位点的方法,其特征在于,所述方法包括:分别将疾病组和正常组的核酸样品等量混样,获得疾病组样品和正常组样品;分别以所述疾病组样品和正常组样品为模板,对关注的易感基因的外显子全长进行PCR,获得扩增产物并测序,获得疾病组和正常组测序数据;将所述疾病组和正常组测序数据分别通过质量筛选后,与基因组参考序列进行对比并分析,获得所有SNP位点、对应每个SNP位点的测序片段、和每个所述测序片段的支持数;对每个所述SNP位点进行注释,统计正常组和疾病组中每个SNP位点中每种等位基因出现的频率;通过比较疾病组中和正常组中每个SNP位点中每种等位基因出现的频率之差,筛选疾病组相对正常组显著差异的SNP位点,获得潜在风险SNP位点。2.根据权利要求1所述的一种混样筛选潜在风险单核苷酸多态性等位位点的方法,其特征在于,所述疾病组样品中包含多种含有等量核酸样品的疾病样本;所述正常组样品中包含多种含有等量核酸样品的正常样本;所述疾病组样品与所述正常组样品的样品数相等或不相等。3.根据权利要求1所述的一种混样筛选潜在风险单核苷酸多态性等位位点的方法,其特征在于,所述关注的易感基因包括五个,分别为PARK2、PINK1、Vps35、EIF4G1、LRRK2,对关注的易感基因的外显子全长进行PCR时采用的引物对分别如SEQ ID NO.1

SEQ ID NO.2所示、SEQ ID NO.3

SEQ ID NO.4所示、SEQ ID NO.5

SEQ ID NO.6所示、SEQ ID NO.7

SEQ ID NO.8所示、SEQ ID NO.9

SEQ ID NO.10所示。4.根据权利要求1所述的一种混样筛选潜在风险单核苷酸多态性等位位点的方法,其特征在于,所述质量筛选包括:使用cutadapt从原始测序片段序列中去掉adaptor,后使用FASTX Toolkit(v0.0.14)处理片段序列,去除末端低质量碱基并删除低质量片段序列,其中,所述末端低质量碱基为质量&...

【专利技术属性】
技术研发人员:陈栋王启张倩程超常永杰卯江明
申请(专利权)人:武汉瑞兴生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1