一种基于ITS序列和机器学习的沉香属植物鉴定方法技术

技术编号:24441801 阅读:97 留言:0更新日期:2020-06-10 12:11
本发明专利技术公开了一种基于ITS序列和机器学习的沉香属物种鉴定方法,包括以下步骤:(1)收集土沉香、云南沉香、毛沉香、卡明沉香、小果沉香、具喙沉香的ITS序列;(2)利用机器学习提取鉴别该6个沉香属物种的特异核苷酸位点;(3)对该6个沉香属物种进行鉴别。将ITS序列和机器学习结合对6个沉香属物种进行鉴定的方法,该方法能够减少从多个变异位点中手动筛选核苷酸位点来鉴定物种的时间,提高了鉴定效率;同时还能避免因某个位点变异而不能满足多个位点同时存在作为鉴定物种的依据而造成鉴定失败的情况,保证了鉴定的准确性和特异性,从而实现快速、高准确性、高特异性地鉴定6个沉香属物种。

A method for identification of aloes based on its sequence and machine learning

【技术实现步骤摘要】
一种基于ITS序列和机器学习的沉香属植物鉴定方法
本专利技术涉及一种沉香属物种的鉴定方法,更具体地,设计一种ITS序列和机器学习鉴定土沉香、云南沉香、毛沉香、卡明沉香、小果沉香、具喙沉香的方法。
技术介绍
瑞香科(Thymelaeaceae)沉香属(Aquilaria)植物是热带及亚热带常绿乔木,大多分布于印度尼西亚、马来西亚、越南等东南亚国家。沉香,即沉香属植物受伤后分泌的树脂与木质结合在一起形成的融合物。沉香是我国及其他东南亚国家沿用历史悠久的珍贵传统药材,其价值极高,被誉为“药中黄金”。沉香其味辛苦,性微温,具行气止痛、文中止呕、纳气平喘等功效,可用于胸腹胀闷疼痛、胃寒呕吐呃逆、肾虚气逆喘息。除了具有极高的药用价值,沉香也是制作高级香料的必备材料,同时,沉香还可以制作雕刻品、家具等产品,倍受国内外消费者的欢迎。但由于需索无度,长期无节制的毁灭性采香,使得野生沉香植物濒临灭绝。目前已发现有多种沉香属物种可形成沉香,而不同沉香物种、不同结香方法产生的沉香在沉香品质、化学成分含量、药用价值及市场价格方面具有较大差异,单靠形态、化学组分分析等方法本文档来自技高网...

【技术保护点】
1.一种基于ITS序列和机器学习的沉香属物种鉴定方法,其特征在于,包括以下步骤:/nS1.数据的获取和数据集的建立/n获取6个沉香属物种的ITS区序列,并进行比对,切除引物端后,去除存在高度缺失的序列,得到用于机器学习的数据集;/nS2.利用机器学习提取鉴定6个沉香属物种的核苷酸特征/n以Barcoding with logic作为机器学习方法,将S1得到的数据集进行100次-1000次迭代计算,得到鉴定6个沉香属物种的核苷酸特征;/nS3.6个沉香属物种的鉴定/n鉴定6个沉香属物种的特异核苷酸位点,具体标准是:/n若第619为碱基为G,则鉴定为土沉香Aquilaria sinensis;/n...

【技术特征摘要】
1.一种基于ITS序列和机器学习的沉香属物种鉴定方法,其特征在于,包括以下步骤:
S1.数据的获取和数据集的建立
获取6个沉香属物种的ITS区序列,并进行比对,切除引物端后,去除存在高度缺失的序列,得到用于机器学习的数据集;
S2.利用机器学习提取鉴定6个沉香属物种的核苷酸特征
以Barcodingwithlogic作为机器学习方法,将S1得到的数据集进行100次-1000次迭代计算,得到鉴定6个沉香属物种的核苷酸特征;
S3.6个沉香属物种的鉴定
鉴定6个沉香属物种的特异核苷酸位点,具体标准是:
若第619为碱基为G,则鉴定为土沉香Aquilariasinensis;
若第105位碱基为T,则鉴定为云南沉香A.yunanensis;
若第570位碱基为C,则鉴定为毛沉香A.hirta;
若第569位碱基为A,则鉴定为卡明沉香A.cumingiana;
若第622位碱基为T,则鉴定为小果沉香A.microcarpa;
若第634位碱基为A,则鉴定为具喙沉香A.rostrata。


2.根据权利要求1所述的基于ITS序列和机器学习的6个沉香属物种鉴定方法,其特征在于,在步骤S1中,ITS区序列一部分来自于实验获取,物种是土沉香、云南沉香和毛沉香,通过分子生物学实验及测序获得该3个沉香属物种的ITS区序列,具体包括如下步骤:
S11.采用改良CTAB法,对3个待测物种样品的总DNA进行提取;
S12.以3个待测物种样品的总DNA为模板,利用引物ITS5和ITS4进行PCR扩增;
S13.扩增产物纯化后连接到载体PMD18-T,连接产物转化到E.coliJM109感受态细胞,进行氨苄青霉素选择,对阳性菌落进行测序,测序引物与PCR扩增引物一致,得到ITS区序列。


3.根据权利要求1所述的基于ITS序列和机器学习的沉香属物种鉴定方法,其特征在于,在步骤S1中,ITS区序列一部分来自于GenBank,物种是土沉香、云南沉香、毛沉香、卡明沉香、小果沉香、具喙沉香。


4.根据权利要求3所述的基于ITS序列和机器学习的沉香属物种鉴定方法,其特征在于,在步骤S1中,将实验获得的与从GenBank下载的ITS区序列合为一个文件并导入MEGA7...

【专利技术属性】
技术研发人员:朱爽冯婷婷梁文杰邓锦思林月霞
申请(专利权)人:广东药科大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1