【技术实现步骤摘要】
一种基因多序列比对方法、设备和系统
[0001]本专利技术属于生物信息学
,具体涉及一种基因多序列比对方法、设备和系统。
技术介绍
[0002]基因的多序列比对是生物信息学的基本组成和重要基础。序列比对的基本思想是,基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,检测序列之间的相似性,发现生物序列中的功能、结构和进化的信息。
[0003]例如,裂腹鱼类Cytb基因多序列对比是一种重要的基因多序列比对研究体系。细胞色素b基因(Cytb)是真核生物线粒体基因组中的一个编码基因,因其单拷贝、进化速率适中、多态性位点丰富等优点,是常用于研究生物遗传进化及多样性的靶基因。裂腹鱼类是青藏高原及周边地区特有的一个鲤科裂腹鱼亚科的鱼类物种类群,是我国青藏高原地区重要的渔业资源和生态关键物种。在物种的起源和进化上,裂腹鱼类的物种都有较近的亲缘关系,形态上较为相似,在Cytb基因的序列结构上既有不同物种特异的多态位点,也有裂腹鱼类共有的保守基序。因此,Cytb基因是 ...
【技术保护点】
【技术特征摘要】
1.一种基因多序列比对方法,其特征在于,包括如下步骤:步骤1,设置模板信息,所述模板信息包括待分析基因的模板序列和保守基序的信息;步骤2,根据步骤1的模板信息作为参照,对待分析序列进行校正和多序列全局比对,形成数据集。2.按照权利要求1所述的基因多序列比对方法,其特征在于:步骤1中,所述模板信息是通过待分析基因的正义链简并序列获得的。3.按照权利要求1所述的基因多序列比对方法,其特征在于:步骤2中,进行校正和多序列全局比对的具体步骤如下:步骤2.1,根据步骤1的模板信息作为参照,识别待分析序列中的反义链序列,将所述反义链序列处理为正义链序列;步骤2.2,根据步骤1的模板信息作为参照,识别经过步骤2.1处理后的待分析序列中的引物、接头和终止密码子之后的测序载体序列,并将所述测序载体序列剪切舍弃;步骤2.3,对经过步骤2.2处理后的待分析序列进行多序列全局对比,形成比对后的数据集;步骤2.4,根据步骤1的模板信息作为参照,校对步骤2.3得到的数据集,填补5
’‑
和3
’‑
端残缺的序列,删除非比对区序列;步骤2.5,对经过步骤2.4处理后的数据集进行多序列全局对比,识别包含测序错误位点的序列样本,删除包含测序错误位点的序列样本或对包含测序错误位点的序列样本进行调整。4.按照权利要求3所述的基因多序列比对方法,其特征在于:步骤2.5中,识别包含测序错误位点的序列样本的方法为:对经过步骤2.4处理后的数据集中的序列样本的每个位点基...
【专利技术属性】
技术研发人员:刘思嘉,田菲,陈生学,田得红,王贺崐元,赵凯,
申请(专利权)人:中国科学院西北高原生物研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。