一种人体肠道健康状态的特征表达方法及其评估方法技术

技术编号:28945405 阅读:14 留言:0更新日期:2021-06-18 21:58
本发明专利技术提供了一种人体肠道健康状态的特征表达方法及其评估方法,其中人体肠道健康状态的特征表达方法包括:准备A组样本和B组样本;计算各个菌种在A组样本和B组样本的频率和相对丰度,得到A组样本的优势菌集合GA和B组样本的优势菌集合GB;根据输入样本的各个菌种的相对丰度,得到输入样本的alpha多样性参数;通过A组样本的聚类中心点和聚类半径等计算输入样本与A组样本的相似度;通过输入样本中输入样本中优势菌集合GA的集体丰度以及输入样本中优势菌集合GB的集体丰度得到输入样本的健康系数。采用本发明专利技术的技术方案,可以对一些具体研究领域的健康状况进行定量分析和评估,从而让客户更好地了解自己的身体健康状态。

【技术实现步骤摘要】
一种人体肠道健康状态的特征表达方法及其评估方法
本专利技术属于生命科学和数据挖掘
,尤其涉及一种人体肠道健康状态的特征表达方法及其评估方法。
技术介绍
人体内的肠道微生态环境和大量复杂的慢性疾病有关,如肠道微生物和癌症、自身免疫疾病和代谢综合症之间存在联系。国内外的大量研究发现肠道微生物可用于阐明大量疾病的病理机制,也可被用于开发一些顽固疾病的干预策略。由于人类摄入的食品饮料在进入血液代谢之前要经过肠道微生物环境的预处理,人体内的肠道环境可能在宿主健康和疾病中发挥重要作用,这一领域的深入研究和知识转化有利于开发新型的分析测试或定量方法,例如可以根据肠道微生物的丰度指标描述宿主的健康状况。事实上目前用肠道菌群作为标志物进行健康检测,是菌群转化研究的热点之一。目前的肠道微生物学在开发基于无创型粪便的测试、动态监测和预测健康方面有望发挥重要作用。人们可以通过持续监测自己的肠道微生物丰度的显著变化或异常,或者通过把自己的肠道微生物检测结果和健康组基线数据比较,来进一步了解自己的身体健康状态,从而选择适合自己的健康干预方式;但是对于个体的健康状况,并不能给出定量的分析评价。
技术实现思路
针对以上技术问题,本专利技术公开了一种人体肠道健康状态的特征表达方法及其评估方法,提供了一种多角度优势菌群的筛选方案,并在此基础上构建用于描述人体肠道健康状态的数学模型,该方法有利于肠道微生物标志物的筛选,并对一些具体研究领域的健康状况做定量分析描述。对此,本专利技术采用的技术方案为:一种人体肠道健康状态的特征表达方法,其特征在于,其包括:步骤S1,准备A组样本和B组样本,其中A组样本中每种菌种的平均相对丰度小于θAr,并含有长寿高龄样本,B组样本存在平均相对丰度大于θBr的菌种;步骤S2,计算各个菌种在A组样本和B组样本的频率和相对丰度,得到A组样本的优势菌集合GA和B组样本的优势菌集合GB;步骤S3,根据输入样本的各个菌种的相对丰度,得到输入样本的alpha多样性参数;步骤S4,根据A组中各个样本不同菌种的相对丰度,得到A组样本的聚类中心点和聚类半径radius_A;并根据输入样本的不同菌种的相对丰度,计算输入样本和A组各样本的欧氏距离,得到输入样本与A组样本的欧氏距离最小值min_A_distance;计算输入样本和B组各样本的欧氏距离,得到输入样本与B组样本的欧氏距离最小值min_B_distance;若min_A_distance<min_B_distance,则采用如下公式计算得到相似度similarity;similarity=(radius_A-distance)/radius_A;其中,distance为输入样本与A组样本的聚类中心点的欧式距离;similarity最大值为1,也可以为负值,负值表示不相似。若min_A_distance≥min_B_distance,则similarity=0;步骤S5,计算输入样本中优势菌集合GA的集体丰度TA,以及输入样本中优势菌集合GB的集体丰度TB,采用如下公式计算得到输入样本的健康系数factor;factor=log10(TA/TB)。进一步的,所述长寿高龄样本的数量在A组样本中的占比不少于30%。进一步的,所述长寿高龄样本中,95岁以上老人数量比例不小于11%,85岁以上老人数量比例不小于21%。作为本专利技术的进一步改进,步骤S1中,对样本进行预处理,删掉不合格样本。作为本专利技术的进一步改进,对于A组样本,过滤掉有疾病史和抗生素服用史的样本。作为本专利技术的进一步改进,步骤S2中,菌种j在A组样本中的频率为PA,j=cA,j/NA;菌种j在B组样本中的频率为PB,j=cB,j/NB;其中,j为菌种的序号,cA,j为A组样本中含有菌种j的样本数,NA为A组样本的总数;cB,j为B组样本中含有菌种j的样本数,NB为B组样本的总数;菌种j在A组样本中所有样本中的平均相对丰度为其中,i为A组样本中的样本序号,ri,j为菌种j在样本i中的相对丰度;菌种j在B组样本中所有样本中的平均相对丰度为其中,k为B组样本中的样本序号,rk,j为菌种j在样本k中的相对丰度;计算A组样本、B组样本菌群中不同菌种的频率差异参数dPAB,j=PA,j-PB,j,计算A组样本、B组样本菌群中不同菌种的相对丰度差异参数dRAB,j=ARA,j-ARB,j;若菌种j满足dPAB,j≥θp1>0,dRAB,j≥θR1>0,则筛选为A组的优势菌种,这些菌种记为优势菌集合GA;若菌种j满足dPBA,j≥θp2>0,dRBA,j≥θR2>0,则筛选为B组的优势菌种,这些菌种记为优势菌集合GB;其中,θp1为A组优势菌种的频率阈值,θR1为A组优势菌种的丰度阈值,θp2为B组优势菌种的频率阈值,θR2为B组优势菌种的丰度阈值。作为本专利技术的进一步改进,步骤S3中,根据输入样本的alpha多样性参数与A组样本、B组样本的alpha多样性参数进行比较,确定输入样本属于A组样本或B组样本的范围。作为本专利技术的进一步改进,所述输入样本的alpha多样性参数采用如下公式计算得到:alpha=∑|rjln(rj)|,其中,rj为菌种j在输入样本的相对丰度。本专利技术还公开了一种人体肠道健康状态的评估方法,其包括:根据如上任意一项所述的人体肠道健康状态的特征表达方法得到输入样本的alpha多样性参数,输入样本的相似度similarity和输入样本的健康系数factor,进行肠道健康状况评估,得到健康状况。作为本专利技术的进一步改进,若alpha>alpha_A_min,similarity≥θsim,健康系数factor>0,则该输入样本的健康状态为健康肠型;其中,alpha_A_min为A组样本的菌种丰度多样性的最小值;θsim为设定的相似度阈值。与现有技术相比,本专利技术的有益效果为:采用本专利技术的技术方案,提供了一种多角度优势菌群的筛选方案,并在此基础上构建了用于描述人体肠道健康状态的数学模型,采用该数学模型,可以有利于肠道微生物标志物的筛选,可以对一些具体研究领域的健康状况进行定量分析和评估,可以更好的了解自己的身体健康状态。附图说明图1是本专利技术一种人体肠道健康状态的特征表达方法的样本数据处理部分的流程图。图2是本专利技术一种人体肠道健康状态的特征表达方法的参数输出的流程图。具体实施方式下面对本专利技术的较优的实施例作进一步的详细说明。一种人体肠道健康状态的特征表达方法,其包括:步骤S1,准备A组样本和B组样本,对样本进行预处理,删掉不合格样本,A组样本,过滤掉有疾病史和抗生素服用史的样本。其中A组样本中每种菌种的平均相对丰度小于15%,并含有不少于30%的长寿高龄样本本文档来自技高网...

【技术保护点】
1.一种人体肠道健康状态的特征表达方法,其特征在于,其包括:/n步骤S1,准备A组样本和B组样本,其中A组样本中每种菌种的平均相对丰度小于θ

【技术特征摘要】
1.一种人体肠道健康状态的特征表达方法,其特征在于,其包括:
步骤S1,准备A组样本和B组样本,其中A组样本中每种菌种的平均相对丰度小于θAr,B组样本存在平均相对丰度大于θBr的菌种;
步骤S2,计算各个菌种在A组样本和B组样本的频率和相对丰度,得到A组样本的优势菌集合GA和B组样本的优势菌集合GB;
步骤S3,根据输入样本的各个菌种的相对丰度,得到输入样本的alpha多样性参数;
步骤S4,根据A组中各个样本不同菌种的相对丰度,得到A组样本的聚类中心点和聚类半径radius_A;并根据输入样本的不同菌种的相对丰度,计算输入样本和A组各样本的欧氏距离,得到输入样本与A组样本的欧氏距离最小值min_A_distance;计算输入样本和B组各样本的欧氏距离,得到输入样本与B组样本的欧氏距离最小值min_B_distance;
若min_A_distance<min_B_distance,则采用如下公式计算得到相似度similarity;
similarity=(radius_A-distance)/radius_A;
其中,distance为输入样本与A组样本的聚类中心点的欧式距离;
若min_A_distance≥min_B_distance,则similarity=0;
步骤S5,计算输入样本中优势菌集合GA的集体丰度TA,以及输入样本中优势菌集合GB的集体丰度TB,采用如下公式计算得到输入样本的健康系数factor;
factor=log10(TA/TB)。


2.根据权利要求1所述的人体肠道健康状态的特征表达方法,其特征在于:步骤S1中,对样本进行预处理,删掉不合格样本。


3.根据权利要求2所述的人体肠道健康状态的特征表达方法,其特征在于:对于A组样本,过滤掉有疾病史和抗生素服用史的样本。


4.根据权利要求3所述的人体肠道健康状态的特征表达方法,其特征在于:步骤S2中,
菌种j在A组样本中的频率为PA,j=cA,j/NA;
菌种j在B组样本中的频率为PB,j=cB,j/NB;
其中,j为菌种的序号,cA,j为A组样本中含有菌种j的样本数,NA为A组样本的总数;cB,j为B组样本中含有菌种j的样本数,NB为B组样本...

【专利技术属性】
技术研发人员:陈晓春
申请(专利权)人:广西爱生生命科技有限公司
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1