一种真核生物来源成分的分子鉴定方法及系统技术方案

技术编号:15864292 阅读:54 留言:0更新日期:2017-07-23 09:18
本发明专利技术公开了一种真核生物来源成分的分子鉴定方法及系统,该方法包括步骤:将检材DNA的全基因组鸟枪法测序序列作为输入数据进行输入;对输入数据进行特征计算;使用预存在数据库中的标准序列对输入数据特征进行查询,获得输入数据特征同标准序列的比对结果;根据比对结果进行物种判定。本发明专利技术适用范围广、通用性强。

【技术实现步骤摘要】
一种真核生物来源成分的分子鉴定方法及系统
本专利技术属于生物
,具体涉及一种真核生物来源成分的分子鉴定方法及系统。
技术介绍
现有鉴定真核生物来源成分的分子生物学方法几乎都是基于特异性核酸探针的方法。例如,基于特异性引物的聚合酶链式反应(PCR)扩增,或者特异性寡聚核苷酸探针(生物芯片)的方法。通过考察PCR反应扩增产物的电泳条带/测序结果,或是根据探针的杂交信号进行有限的成分来源判断。这些方法的缺陷是一个测试中能鉴定物种的分类阶元范围有限,通用性差,通量低并且假阴性率高(分子探针脱靶)。面对检材成分完全未知的情况下,往往无法选择合适的探针进行工作。
技术实现思路
技术问题是为真核生物来源成分的分子鉴定提供一种适用范围广、通用性强的分子鉴定方法及系统。有鉴于此,本专利技术实施例提供一种真核生物来源成分的分子鉴定方法及系统用以解决上述的技术问题。问题的解决方案:本专利技术提供了一种真核生物来源成分的分子鉴定方法,包括步骤:将检材DNA的全基因组鸟枪法测序序列作为输入数据进行输入;对输入数据进行特征计算;使用预存在数据库中的标准序列对输入数据特征进行查询,获得输入数据特征同标准序列的比对结果;根据比对结果进行物种判定。进一步的,所述检材DNA的全基因组鸟枪法测序序列包括原始测序序列和序列拼装。本方案中,该方法在适用于单种真核生物来源成分判定的同时,也能够完成混合样本的真核生物来源成分的判定。进一步的,所述输入数据是由高通量并行测序设备接口输出的。过高通量并行测序取得数据,使得混合来源样本可以得到区分识别。进一步的,所述使用标准序列对输入数据特征进行查询,获得输入数据特征同标准序列的比对结果的步骤包括:将输入数据特征和数据库中标准序列的标准分子标记序列特征进行匹配、距离计算和打分排序;进行统计推断,得到输入数据中含有的分子标记序列特征的来源推断和相对含量;从输入数据中获取标记分子序列,并和标准分子标记序列进行对比,确认来源成分。通过对计算得到的输入数据特征,进行同标准序列的对比,并通过匹配、距离计算和打分排序,能够搜索匹配数据库中的记录,并判断命中记录的真实性概率。进一步的,所述根据比对结果进行物种判定的步骤包括:对来源成分进行定性和定量分析,输出物种判定结果。进一步的,所述标准分子标记序列包括细胞器基因组中的序列如CO1基因序列、rbcl基因序列和matK基因序列的一种或多种;所述标准分子标记序列特征包括使用滑动窗口切割CO1基因序列、rbcl基因序列和matK基因序列中的一种或多种得到的预存K-mer数据;所述输入数据特征包括切割输入数据得到的K-mer片段。本方案中,该标准分子标记序列将主要通过其中的CO1基因序列、rbcl基因序列或matK等基因序列进行对比。进一步的,在序列匹配时,预存K-mer数据将作为虚拟探针,同输入数据中的K-mer片段进行匹配,以判断预存K-mer数据是否对应存在于输入数据中。将输入数据和标准序列切割为相同的K-mer长度,直接对原始数据中的k-mer成分进行有无分析,使得检测限可低至输入仅含一条标记分子序列,灵敏度高。进一步的,若某一分子标记预存的K-mer数据被判定对应存在于输入数据中,则将该预存K-mer数据对应的标准分子标记序列作为对比模板,同输入数据的原始数据或拼装数据进行比对,以获得物种判定结果。本方案中,根据分子标记的计数判断相对丰度,并输出结果。进一步的,所述数据库至少包括线粒体/叶绿体基因组数据库,线粒体/叶绿体基因组内含基因的序列片段数据库,线粒体/叶绿体基因组元信息数据库,线粒体/叶绿体基因组序列衍生特征数据库。这些数据库在鉴定过程的不同步骤中使用。本专利技术还提供了一种真核生物来源成分的分子鉴定系统,其特征在于,包括:高通量并行测序设备接口,用于将检材DNA进行测序,并将得到的全基因组鸟枪法测序序列作为输入数据进行输入;特征计算单元,用于对输入数据进行特征计算;数据库,用于存储包括标准序列在内的数据;对比单元,用于使用标准序列对输入数据特征进行查询,获得输入数据特征同标准序列的对比结果;判定单元,用于根据对比结果进行物种判定。本专利技术的有益效果是:本专利技术中,由于设置了存储有丰富种类的真核生物标准序列的数据库的存在,因而能够适用检材DNA的全基因组鸟枪法测序序列作为输入数据,而无须特异性聚合酶链式反应(PCR)扩增或特异性寡聚核苷酸探针(生物芯片)作为检测技术,无对检材来源的预先假设。因而能够鉴定的分类阶元范围广,种类多;以此为基础进行物种判定,鉴定物种的能力主要限制于数据库中参比序列的内容,不会受到上游实验过程的限制(如靶向捕获步骤等),通用性极强。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本专利技术实施例的内容和这些附图获得其他的附图。图1是本专利技术一种真核生物来源成分的分子鉴定方法的流程图;图2是本专利技术一种真核生物来源成分的分子鉴定系统的示意图。贯穿附图,应该注意的是,相似的标号用于描绘相同或相似的元件、特征和结构。具体实施方式提供以下参照附图的描述来帮助全面理解由权利要求及其等同物限定的本公开的各种实施例。以下描述包括帮助理解的各种具体细节,但是这些细节将被视为仅是示例性的。因此,本领域普通技术人员将认识到,在不脱离本公开的范围和精神的情况下,可对本文所述的各种实施例进行各种改变和修改。另外,为了清晰和简洁,公知功能和构造的描述可被省略。以下描述和权利要求书中所使用的术语和词汇不限于文献含义,而是仅由专利技术人用来使本公开能够被清晰和一致地理解。因此,对于本领域技术人员而言应该明显的是,提供以下对本公开的各种实施例的描述仅是为了示例性目的,而非限制由所附权利要求及其等同物限定的本公开的目的。应该理解,除非上下文明确另外指示,否则单数形式也包括复数指代。因此,例如,对“组件表面”的引用包括对一个或更多个这样的表面的引用。图1是本专利技术一种真核生物来源成分的分子鉴定方法的流程图,该方法包括步骤:S1:将检材DNA的全基因组鸟枪法测序序列作为输入数据进行输入;S2:对输入数据进行特征计算;S3:使用预存在数据库中的标准序列对输入数据特征进行查询,获得输入数据特征同标准序列的比对结果;S4:根据比对结果进行物种判定。本专利技术的有益效果是:本专利技术中,由于设置了存储有丰富种类的真核生物标准序列的数据库的存在,因而能够适用检材DNA的全基因组鸟枪法测序序列作为输入数据,而无须特异性聚合酶链式反应(PCR)扩增和特异性寡聚核苷酸探针(生物芯片)作为检测设备,因而使得能够鉴定物种的分类阶元范围广;并且,在对输入数据进行特征计算后,使用输入数据特征同标准序列进行对比,可以判断输入数据中包含的基因组分的来源,以此为基础进行物种判定,鉴定物种的能力主要限制于数据库中参比序列的内容,不会受到上游实验过程的限制(如靶向捕获步骤等),通用性极强。本专利技术实际上利用了细胞器基因组比核基因组拷贝数高2到4个数量级的生物学特性,通过较低的全基因组鸟枪法(WGS)测序深度,即可获得完整的细胞器基因组中遗传标记的序列。本本文档来自技高网...
一种真核生物来源成分的分子鉴定方法及系统

【技术保护点】
一种真核生物来源成分的分子鉴定方法,其特征在于,包括步骤:将检材DNA的全基因组鸟枪法测序序列作为输入数据进行输入;对输入数据进行特征计算;使用预存在数据库中的标准序列特征对输入数据特征进行查询,获得输入数据特征同标准序列的比对结果;根据比对结果进行物种判定。

【技术特征摘要】
1.一种真核生物来源成分的分子鉴定方法,其特征在于,包括步骤:将检材DNA的全基因组鸟枪法测序序列作为输入数据进行输入;对输入数据进行特征计算;使用预存在数据库中的标准序列特征对输入数据特征进行查询,获得输入数据特征同标准序列的比对结果;根据比对结果进行物种判定。2.如权利要求1所说的分子鉴定方法,其特征在于,所述检材DNA的全基因组鸟枪法测序序列包括原始测序序列和序列拼装。3.如权利要求2所说的分子鉴定方法,其特征在于,所述输入数据是由高通量并行测序设备输出的。4.如权利要求1所说的分子鉴定方法,其特征在于,所述使用标准序列对输入数据特征进行查询,获得输入数据特征同标准序列的比对结果的步骤包括:将输入数据特征和数据库中标准序列的标准分子标记序列特征进行匹配、距离计算和打分排序;进行统计推断,得到输入数据中含有的分子标记序列特征的来源推断和相对含量;从输入数据中获取标记分子序列,并和标准分子标记序列进行对比,确认来源成分。5.如权利要求4所说的分子鉴定方法,其特征在于,所述根据比对结果进行物种判定的步骤包括:对来源成分进行定性和定量分析,输出物种判定结果。6.如权利要求4所说的分子鉴定方法,其特征在于,所述标准分子标记序列包括细胞器基因组中的序列如CO1基因序列、rbcl基因序列和matK基因序列中的一种或多种;所述标准分子标记序列特征包括使...

【专利技术属性】
技术研发人员:王俊宁
申请(专利权)人:泽塔生物科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1