一种对犬类基因位点集合数据库制造技术

技术编号：22684851 阅读：44 留言：0更新日期：2019-11-30 01:16

本发明专利技术公开了犬类基因位点合集技术领域的一种对犬类基因位点集合数据库，本合集是针对犬类而综合调研的基因位点合集，其中共包括位于Canfam 3.1基因序列上的50811个单核苷酸多态性位点(SNP)与插入缺失(Indels)，其所属基因与犬类血统祖源、外貌性状、遗传病风险三大方面具有显著联系。通过对犬类进行二代基因测序并将结果与本基因位点合集进行比对分析，即可预测出受检犬只的血统分布、外貌(如毛色，耳朵形状等)、性格、遗传病风险等表型。

A set database of canine gene loci

The invention discloses a collection database of canine gene locus in the technical field of canine gene locus collection, which is a comprehensive research gene locus collection for dogs, including 50811 single nucleotide polymorphic sites (SNPs) and insertion deletions (indels) located on canfam 3.1 gene sequence, and its genes and canine pedigree ancestor, appearance character, genetic disease risk There are significant connections among the three aspects. By sequencing the second generation genes of dogs and comparing the results with the gene locus set, we can predict the pedigree distribution, appearance (such as hair color, ear shape, etc.), character, genetic disease risk and other phenotypes of dogs.

全部详细技术资料下载

【技术实现步骤摘要】
一种对犬类基因位点集合数据库
本专利技术涉及犬类基因位点合集
，具体为一种对犬类基因位点集合数据库。
技术介绍
SNP是单核苷酸多态性(SingleNucleotidePolymorphism)的简写，是指基因组上单个核苷酸变异，即A、T、C、G四种碱基的互相改变，形成基因组上同一位置会有多种碱基存在的多态性。SNP在人群中广泛存在，多态性丰富，是很好的遗传标记物。尤其高通量的SNP检测方法出现之后，被广泛用于生物信息学的分析；NP基因分型指的是确定SNP的碱基对类型，除了未检出情况，总共有4*4＝16种可能结果。基因分型的不同，可能导致样本的表型不同；祖源分析是指从遗传学角度来描绘每个人的祖先是谁，来自哪个族群。而SNP的多态性因为不同族群演化历史不同，都会有带有很强的族群特异性，可以被用来反映族群的遗传特征。通过计算比对，可获得不同的祖源成分比例；目前，未检索到专门针对犬类定制基因位点集合的专利。目前该领域内暂未发现有相同或相似的研究，犬类的全基因组已经于2011由美国国立生物技术信息中心(...

【技术保护点】
1.一种对犬类基因位点集合数据库，其特征在于：/n具体技术方案：/n1.)选定合适的参考基因序列，慧宠选用了最新版本的Can Fam 3.1序列为参考序列。/n2.)搜集与犬类基因测序相关的文献，搜索关键词包括如【Canine GenomeSequencing】、【Canine Ancestry Gene】、【Canine Hereditary Disease Gene】等。记录每篇适用文献所记载的测序序列、序列版本、位点信息、受检犬只相关表型。/n3.)收集实体样本(犬口腔上皮细胞)进行上机测序。主要用途有两部分，/n一：通过真实样本验证文献中所提及的位点与表型的相关性，对于和实际测试中没有...

【技术特征摘要】
1.一种对犬类基因位点集合数据库，其特征在于：
具体技术方案：
1.)选定合适的参考基因序列，慧宠选用了最新版本的CanFam3.1序列为参考序列。
2.)搜集与犬类基因测序相关的文献，搜索关键词包括如【CanineGenomeSequencing】、【CanineAncestryGene】、【CanineHereditaryDiseaseGene】等。记录每篇适用文献所记载的测序序列、序列版本、位点信息、受检犬只相关表型。
3.)收集实体样本(犬口腔上皮细胞)进行上机测序。主要用途有两部分，
一：通过真实样本验证文献中所提及的位点与表型的相关性，对于和实际测试中没有显著关联的位点进行过滤。
二：补充文献上不曾报道测序过的犬种类，如藏獒，美国恶霸犬等，通过增添这些种类的数据来提高整个基因合集(特指血统祖源方面)的完整度。
4.)样本分析流程如下：
a.使用口腔拭子采集目标犬只的口腔上皮细胞样本，并记录受检犬只的各项表型信息。
b.对收集样本进行DNA提取，此流程采用CommaXPSwabDNAKit试剂盒，具体操作依照操作指南执行。
c.使用二代测序技术对DNA样本进行上机测序，获得样本的基因序列rawdata。
d.原始数据与本位点集合数据库进行比对，即callvariant,比对后得到该样本的变异位点数据。
e.其位点变异位点进一步与本数据库进行注释比对，即annotation，最终得到该样本中的位点变异相关的表型信息。
5.)构建数据库文件，按照统一格式录入筛选好的位点信息，并且添加数据库管理日志，对每一次数据库的添加/删改等操作进行记录。
6.)收录的位点数据库中每一条数据共包含以下几种条目：
位点染色体坐标、所属基因、变异模式、参考序列、对应表型、遗传模式、旁侧序列、等位基因。
截至2019年8月，本位点数据库已收录与血统祖源相关位点50398个，遗传病相关位点共159个，外貌特征相关位点200个，行为性状相关位点46个，用药安全8个，本位点数据库将持续整理更新。
基因序列说明：A、C、G和T分别代表组成DNA的四种核苷酸——腺嘌呤，胞嘧啶，鸟嘌呤，胸腺嘧啶，每个字母代表一种碱基，两个碱基形成一个碱基对，碱基对的配对规律是固定的，即是：A-T,C-G，典型的他们无间隔的排列在一起，例如序列AAAGTCTGAC，任意长度大于4的一串核苷酸被称作一个序列。
所用到的DNA提取试剂来自于CommaXPSwabDNAKit试剂盒，其具体组成与操作如下：
试剂盒组成：

该工艺包括如下步骤：
步骤一：实验准备
a：第一次使用前，BufferPD、BufferPW中加入指定体积的无水...

【专利技术属性】
技术研发人员：邱广斌，
申请(专利权)人：深圳市慧思基因科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人