一种利用宏基因组和机器学习进行蜂蜜蜜源地追踪的方法技术

技术编号:30901410 阅读:42 留言:0更新日期:2021-11-22 23:45
本发明专利技术公开了一种利用宏基因组和机器学习进行蜂蜜蜜源地追踪的方法。该方法充分考虑蜂蜜蜜源地,尤其是偏远山区,植物物种的分子数据库匮乏的问题,分析蜂蜜中核酸物质的序列信息,进而得到蜂蜜中所包含的植物序列,然后通过机器学习的方法计算得到蜂蜜中植物源的核酸序列(不需要具体的物种鉴定结果)与其蜜源地的权重关系,并以此作为参考数据库进行蜂蜜样品的蜜源地追踪。该方法不依赖已有的蜜源地植物分子数据库,可以直接通过蜂蜜中植物序列分析和机器学习得到蜂蜜的蜜源地信息,对蜂蜜产品的鉴定和市场的规范有着极其重要的价值。值。值。

【技术实现步骤摘要】
一种利用宏基因组和机器学习进行蜂蜜蜜源地追踪的方法


[0001]本专利技术涉及宏基因组测序、物种多样性分析、机器学习和生物信息学领域,具体涉及一种利用宏基因组和机器学习进行蜂蜜蜜源地追踪的方法。

技术介绍

[0002]在国内的蜂蜜市场中,西方蜜蜂采集产生的花蜜大多是单一花种蜂蜜(单花蜜),例如槐花蜜、油菜蜜等,而中华蜜蜂采集产生的往往是多花种蜂蜜(百花蜜)。西方蜜蜂相较于中华蜜蜂而言具有更好的产蜜能力,因此,在1900年前后被首次引入中国。并且随着西方蜜蜂的引入,一系列现代产业化的管理模式也随之引入,比如蜂群的日常清理和迁移。而大量地方上的蜂农对饲养中华蜜蜂依然具有更高的热情,尤其是在比较偏远的山区。尽管如此,西方蜜蜂的引入不可避免的致使中华蜜蜂种群受到威胁,导致在过去的100多年时间里种群密度的大幅下降。中华蜜蜂种群受到的影响多集中在农业活动密集的区域,而在人口稀疏的山区,西方蜜蜂对当地中华蜜蜂种群的影响有限。两种蜜蜂的生态竞争在蜂蜜生产和市场销售中却带来了意想不到的结果:消费者普遍认为来自农村和山区的蜂蜜产品,是通过原初的生产方式获得,是真本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种蜂蜜的蜜源地追踪方法,包括以下步骤:1)收集已知蜜源地的蜂蜜样品,对蜂蜜样品进行花粉富集并进行核酸物质的抽提和纯化;2)对每个蜂蜜样品进行核酸序列的测定,并对测序数据进行质量过滤;3)对质量过滤之后的测序数据进行组装,并通过将所有的原始测序数据比对回组装结果以得到组装序列的丰富度信息,只保留组装长度大于500bp以及丰富度大于3的组装序列;4)对步骤3)得到的组装序列进行物种信息注释,将组装序列比对到NCBI的核苷酸序列数据库,并记录最优比对结果的物种信息;根据物种的注释信息,提取植物源序列进行后续的分析;5)对步骤4)提取的植物源序列进行样品间的两两比对,根据两两比对的结果首先将同一蜂蜜样品中来自同一物种的组装序列整合,并记录不同样品间共享的序列信息;共享的序列需要满足序列相似度大于等于98%,比对总长大于等于1,000bp;6)对步骤5)中得到的样品间共享的序列信息分析整合,构建不同蜂蜜样品的数据矩阵,其中矩阵的变量为所有蜜蜂样品的植物源代表序列,蜂蜜样品含有这条序列,或者共享该序列,则该蜂蜜样品这条植物源序列变量的值为1,不符合上述情况则计值为0;同时,对蜂蜜样品进行地理位置变量的定值,蜂蜜样品根据其蜜源地得到不同地理位置的概率值,每个蜂蜜样品在其蜜源地的概率值为100%,其他地理位置的概率为0%;7)对步骤6)得到的数据矩阵进行基于神经网络模型的数据训练,其中植物源序列变量作为神经网络的输入层,而地理位置变量作为神经网络的输出层,同时根据输入层变量的数目决定隐含层的数量和神经元的数目;8)对待检测的蜂蜜样品提供输入层变量值,用步骤7)得到的训练模型进行蜜源地概率的估算。2.如权利要求1所述的蜜源地追踪方法,其特征在于,步骤1)每个蜜源地采集多个蜂蜜样品,所采集的蜂蜜样品来自不同的蜂巢和地点。3.如权利要求1所述...

【专利技术属性】
技术研发人员:周欣刘山林
申请(专利权)人:中国农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1