一种基于基因大数据进行祖源分析预测的算法制造技术

技术编号:24332769 阅读:58 留言:0更新日期:2020-05-29 20:31
本发明专利技术涉及基因大数据祖源分析预测技术领域,且公开了一种基于基因大数据进行祖源分析预测的算法,包括祖源成分样本数据的收集、数据预处理、祖源成分分析预测、Y染色体单倍群分析、线粒体单倍群分析、结果展示。目前市场上祖源分析技术多使用开源数据库,其中有关中国个体的样本量较少,导致血统和单倍群分型不准确、不够细致等,这里我们在开源数据库的基础上添加本公司收集的大量中国人样本数据,同时对源数据进行进一步优化,使得输入数据更加准确可靠,从而提高输出结果的精确度,另外本公司自主研发此三种分析中的比对打分算法,从而使得最终结果更加准确和细致。

An algorithm of ancestor analysis and prediction based on gene big data

【技术实现步骤摘要】
一种基于基因大数据进行祖源分析预测的算法
本专利技术涉及基因大数据祖源分析预测
,具体为一种基于基因大数据进行祖源分析预测的算法。
技术介绍
现代生物理论认为,基因是遗传的基本单位。在人类繁殖的过程中,遗传特征通过基因传递给下一代,子代分别从父母双方各获得一套染色体,一方面完成了遗传信息从亲代到子代的传递,另一方面也丰富了子代的遗传特征多样性。在人类族群演化的过程中,DNA中会累计多种遗传突变,也被称为单核苷酸多态性位点(SNP),不同族群累积的突变位点也不尽相同,因此SNP可以在一定程度上反应族群的遗传特征。在父母双方各自将自己一半的染色体遗传给儿子的时候,父亲将传递给子代22条常染色体和一条Y染色体,母亲则贡献另外一半常染色体和一条X染色体,因此男性的Y染色体只会从父亲处获得。在Y染色体传递的过程中,也会发生突变,在族群演化的过程中,Y染色体上的SNP被累积了下来,因此由Y染色体上SNP可以推测个体的父系祖源。生物学家通过收集分析不同族群的Y染色体数据,构建了Y染色体单倍群树,树上的节点可准确反映族群间发生分支的突变。通过检测本文档来自技高网...

【技术保护点】
1.一种基于基因大数据进行祖源分析预测的算法,其特征在于:包括祖源成分样本数据的收集、数据预处理、祖源成分分析预测、Y染色体单倍群分析、线粒体单倍群分析、结果展示:/n第一步,祖源分析预测中使用数据的收集,包括国际千人基因组计划中的样本数据、Hapmap项目中样本数据以及奇云诺德收集到的大量中国人样本数据;/n第二步数据预处理,奇云诺德公司收集到的样本采用Illumina公司针对亚洲人定制的ASAMD芯片进行基因分型检测,此芯片可检测出66万个有效SNP(single nucleotidepolymorphism,单核苷酸多态性)位点,千人基因组和Hapmap项目中的样本数据采用的技术包括WG...

【技术特征摘要】
1.一种基于基因大数据进行祖源分析预测的算法,其特征在于:包括祖源成分样本数据的收集、数据预处理、祖源成分分析预测、Y染色体单倍群分析、线粒体单倍群分析、结果展示:
第一步,祖源分析预测中使用数据的收集,包括国际千人基因组计划中的样本数据、Hapmap项目中样本数据以及奇云诺德收集到的大量中国人样本数据;
第二步数据预处理,奇云诺德公司收集到的样本采用Illumina公司针对亚洲人定制的ASAMD芯片进行基因分型检测,此芯片可检测出66万个有效SNP(singlenucleotidepolymorphism,单核苷酸多态性)位点,千人基因组和Hapmap项目中的样本数据采用的技术包括WGS(WholeGenomeSequencing,全基因组测序)、WES(WholeExomeSequencing,全外显子测序)以及芯片分型技术等,根据不同来源数据按照统一标准预处理成一个源数据;
第三步祖源成分分析,此分析中我们使用美国加州大学洛杉矶分校(UCLA)开发的Admixture祖源分析软件为原型,在此基础上通过比对个体的基因型与奇云诺德数据库中的参考种族族群样本的相似度,计算出个体祖源成分,我们开发的祖源成分计算方法可以准确地区分美洲、欧洲、非洲和亚洲祖源,并且因为本公司收集到大量中国人群数据,因而亚洲祖源中可也以细分至多个中国地区,计算结果以百分比的方式呈现;
第四步Y染色体单倍群分析,此分析中,我们参...

【专利技术属性】
技术研发人员:罗奇斌申玉林廖胜光任毅
申请(专利权)人:北京奇云诺德信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1