【技术实现步骤摘要】
人体菌群16SrDNA高通量测序物种精确鉴定的优化方法
本专利技术属于分子生物学、医学领域;尤其涉及一种针对人体菌群16SrDNA高通量测序物种精确鉴定的优化方法。
技术介绍
随着测序技术的成熟和成本的下降,人体微生物菌群相关的研究发现和累积了越来越多的菌群测序数据,并获得了大量菌群构成以及与人体健康、疾病和生活状态的相关数据。其中16SrDNA测序作为细菌和古细菌的通用序列,其测序成本低,通用性好,对样本要求低,因此成为菌群研究的中的主要研究技术手段。16SrRNA是细菌中的主要核糖体RNA,对应于基因组DNA上的一段基因序列成为16SrDNA。16SrDNA鉴定是指利用细菌16SrDNA序列测序的方法对细菌进行种属鉴定,包括细菌基因组DNA提取、16SrDNA特异性引物PCR扩增、DNA产物纯化以及DNA测序和序列比对等步骤,可以快速获得细菌种属的信息。16SrDNA普遍存在于原核生物中,在进化中演变极慢,具有多个高度保守的序列,也存在相对中度保守和可变的序列区域,可以通过序列的差异变化来对进化距离不同的各类生物进行亲缘关系的研究。16SrDNA全长大约1540个核苷酸,存在9个可变区域,目前的高通量测序既可对全长也可对其中的一个或多个可变区进行扩增测序,利用可变区序列的差异来对不同菌属、菌种细菌进行分类鉴定。现有的16SrDNA高通量测序分析方法中普遍采用与数据库直接比对,采用97%相似度的种属鉴定,即便采用16S全长测序进行比对,以99%的序列相似度进行种的分类,仍然受限于比对数据库不完整,部分细菌1 ...
【技术保护点】
1.人体菌群16S rDNA高通量测序物种精确鉴定的优化方法,其特征是包括以下步骤:/n1)、建立基于人体微生物样品的人体宏基因组菌基因组数据库;/n2)、提取人体宏基因组菌基因组数据库的全长16S rDNA序列,建立不同人体部位的16SrDNA物种注释数据库;/n3)、建立样本-菌种16S序列丰度相关性网络,并利用该数据训练机器学习模型。/n
【技术特征摘要】
1.人体菌群16SrDNA高通量测序物种精确鉴定的优化方法,其特征是包括以下步骤:
1)、建立基于人体微生物样品的人体宏基因组菌基因组数据库;
2)、提取人体宏基因组菌基因组数据库的全长16SrDNA序列,建立不同人体部位的16SrDNA物种注释数据库;
3)、建立样本-菌种16S序列丰度相关性网络,并利用该数据训练机器学习模型。
2.根据权利要求1所述的人体菌群16SrDNA高通量测序物种精确鉴定的优化方法,其特征是:所述步骤1)包括:
1.1)、获得人体宏基因组测序数据;
1.2)、获得人体病原微生物基因组序列;
1.3)、获得人体宏基因组参考基因组序列;
1.4)、对1.1)所得的来源于人体同一采样部位的人体宏基因组测序数据合并后,进行宏基因组组装、分箱和质量过滤,完整度超过70%且污染少于10%的作为完整基因组;
同一样本来源的完整基因组的fasta序列文件与同一来源的人体宏基因组参考基因组集的fasta序列文件以及全部人体病原微生物基因组的fasta序列文件分别合并成人体各组织部位宏基因组参考序列数据库序列文件。
3.根据权利要求2所述的人体菌群16SrDNA高通量测序物种精确鉴定的优化方法,其特征是:
所述步骤1.1)人体宏基因组测序数据来源包括:
NCBI的sra数据库https://www.ncbi.nlm.nih.gov/sra;
https://www.ebi.ac.uk/metagenomics/;
按照WGS方式对来源于人类同一组织来源的样品进行测序,从而建立基于人体微生物样品的人体宏基因组测序数据库,因此人体宏基因组测序数据符合以下条件:物种为人类,测序方式为WGS,有明确样品来源部位;
所述步骤1.2)为下载目前已完成测序的人体病原微生物基因组序列;
目前已完成测序的人体病原微生物基因组序列的来源包括:
https://www.ncbi.nlm.nih.gov/pathogens/;
所述步骤1.3)为下载已有的人体宏基因组参考基因组序列,包括:
https://data.ace.uq.edu.au/public/gtdb/data/releases/release89/89.0/;
https://img.jgi.doe.gov/cgi-bin/m/main.cgi?section=MetagenomeBins&page=bindetail&type=byecosystem&ecosystem=Host-associated&ecosystem_category=Human;
ftp://ftp.ebi.ac.uk/pub/databases/metagenomics/hgg_mags.tar.gz;
https://www.ncbi.nlm.nih.gov/nuccore/?term=4827...
【专利技术属性】
技术研发人员:金谷雷,牛耀芳,
申请(专利权)人:杭州谷禾信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。