A method and device for identification of microorganism group and device. The method of identifying the microbial group includes: obtaining a plurality of samples from the feature information of the microorganism group of a plurality of organisms, calculating the similarity degree of the first sample in the plurality of samples with the other samples to obtain a number of similarities, and establishing the first one according to the plurality of similarities. The similarity degree probability distribution model of the sample is obtained, the similarity degree of the sample to be measured and the first sample is calculated, and the first probability value of the sample is determined according to the similarity degree of the sample to be measured and the first sample and the similarity probability distribution model of the first sample, and the first probability value is determined according to the first probability. The rate value determines whether the sample to be tested belongs to the same biological individual as the first sample. The scheme provided by this embodiment can effectively identify the microbial group.
【技术实现步骤摘要】
一种微生物组识别方法和装置、设备
本专利技术涉及生物识别技术,尤指一种微生物组识别方法和装置、设备。
技术介绍
微生物遍布于自然环境各个地方,在人体身上也不例外,从内部肠道到外部皮肤,微生物中的主要成员细菌的数量甚至与人体细胞数量相当。微生物不单独出现,常以微生物群落的形式存在,由于现有的实验条件还是很难分离培养所有的微生物,因此就有了通过DNA测序的方法间接获得微生物基础构成的组学,即微生物组学。微生物组是微生物群落所有遗传物质的总和,由于通过高通量测序得到的是混合基因组片段数据,因此用宏基因组来表示微生物组的测序数据。个体的微生物组有很高的特异性,在很多宏基因组测序数据中都得到了证实。一些方法通过对序列进行特征提取来唯一地表征一个人的微生物组,在一定时间内能被作为该人特定的分子标签,并在小样本量的实验中得到了应用。但是,由于个体的微生物组时刻变化,宏基因组测序数据并不像基因组一样稳定,将其作为分子标签并不能持续有效。
技术实现思路
本专利技术至少一实施例提供了一种微生物组识别方法和装置、设备,能有效对微生物组进行识别。为了达到本专利技术目的,本专利技术至少一实施例提供了一种微生物组识别方法,包括:获取多个生物个体的微生物组特征信息生成多个样本,计算该多个样本中第一样本分别与其他样本的相似度以获得多个相似度,根据该多个相似度建立所述第一样本的相似度概率分布模型;获取待测样本,计算所述待测样本与所述第一样本的相似度,根据所述待测样本与所述第一样本的相似度以及所述第一样本的相似度概率分布模型确定所述待测样本的第一概率值,根据所述第一概率值判断所述待测样本与所述第 ...
【技术保护点】
1.一种微生物组识别方法,包括:获取多个生物个体的微生物组特征信息生成多个样本,计算该多个样本中第一样本分别与其他样本的相似度以获得多个相似度,根据该多个相似度建立所述第一样本的相似度概率分布模型;获取待测样本,计算所述待测样本与所述第一样本的相似度,根据所述待测样本与所述第一样本的相似度以及所述第一样本的相似度概率分布模型确定所述待测样本的第一概率值,根据所述第一概率值判断所述待测样本与所述第一样本是否属于同一生物个体。
【技术特征摘要】
1.一种微生物组识别方法,包括:获取多个生物个体的微生物组特征信息生成多个样本,计算该多个样本中第一样本分别与其他样本的相似度以获得多个相似度,根据该多个相似度建立所述第一样本的相似度概率分布模型;获取待测样本,计算所述待测样本与所述第一样本的相似度,根据所述待测样本与所述第一样本的相似度以及所述第一样本的相似度概率分布模型确定所述待测样本的第一概率值,根据所述第一概率值判断所述待测样本与所述第一样本是否属于同一生物个体。2.如权利要求1所述的微生物组识别方法,其特征在于,所述微生物组特征信息包括:微生物组的宏基因组测序数据,或者,微生物组的基因芯片数据,或者,微生物组的染色信息。3.如权利要求2所述的微生物组识别方法,其特征在于,计算相似度时,如果所述微生物组的特征信息为微生物数组的宏基因组测序数据,对所述宏基因组测序数据进行k-mer分割后基于进行k-mer分割后的宏基因组测序数据进行相似度计算,k大于1。4.如权利要求1所述的微生物组识别方法,其特征在于,所述相似度基于MinHash算法获得。5.如权利要求1至4任一所述的微生物组识别方法,其特征在于,所述根据所述第一概率值判断所述待测样本与所述第一样本是否属于同一生物个体包括:当所述第一概率值小于第一预设阈值时,所述待测样本与所述第一样本属于同一生物个体,当所述第一概率值大于等于第一预设阈值时,所述待测样本与所述第一样本不属于同一生物个体。6.如权利要求1至4任一所述的微生物组识别方法,其特征在于,所述方法还包括,建立所述多个样本中除所述第一样本外的其他样本的相似度概率分布模型,获取所述待测样本与所述其他样本的相似度,根据所述待测样本与所述其他样本的相似度以及所述其他样本的相似度概率分布模型确定所述待测样本的其他概率值;所述根据所述第一概率值判断所述待测样本与所述第一样本是否属于同一生物个体包括:对所述第一概率值和所述其他概率值进行错误发现率校正,得到校正后的第一概率值,当所述校正后的第一概率值小于第二预设阈值时,所述待测样本与所述第一样本属于同一生物个体,当所述校正后的第一概率值大于等于第二预设阈值时,所述待测样本与所述第一样本不属于同一生物个体。7.一种微生物组识别装置,其特征在于,包括:信息采集模块,用于获取多个生物个体的微生物组特征信息生成多个样本,以及,获取待测样本;相似度计算模块,用于计算该多个样本中第一样本分别与其他样本的相似度以获得多个相似度;以及,计算所述待测样本与所述第一样本的相似度;相似度分布建立模块,用于根据该多个相似度建立第一样本的相似度概率分布模型;识别模块,用于根据所述待测样本与所述第一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。