基于肠道微生物信息的过敏预测模型构建方法技术

技术编号:37122233 阅读:12 留言:0更新日期:2023-04-01 05:17
本发明专利技术提供了一种基于肠道微生物信息的过敏预测模型构建方法,对受试者的过敏性病史和临床表征信息进行收集,获取肠道微生物原始序列数据并进行注释分析,从而筛选出肠道微生物的物种组成表,选择最优的特征变量合集,构建预测模型并选择出最优过敏预测模型。本发明专利技术利用了机器学习的方式来建立预测过敏的模型,只需要获取受试者的粪便样本即可,不需要对受试者机体造成可能的伤害;此外,建立的基于肠道微生物菌群的预测模型,预测准确率较高,灵敏度和特异性较好,能有效的区分多个样本中过敏与否的结果,为早期预防受试者是否会发生过敏而提供有效的证据。敏而提供有效的证据。敏而提供有效的证据。

【技术实现步骤摘要】
基于肠道微生物信息的过敏预测模型构建方法


[0001]本专利技术涉及过敏预测领域,具体涉及一种过敏预测模型。

技术介绍

[0002]过敏是指机体免疫系统受到特定抗原持续刺激,或同一抗原再次刺激的病理性过度反应,是影响人体健康的常见问题之一。常见的过敏性疾病包含了过敏性鼻炎、过敏性皮肤炎、湿疹、气喘和食物过敏等,而且过敏性疾病的发生率在逐年的增加,过敏症状以及过敏原的出现也在不断增加。
[0003]根据流行病学调查的研究发现,导致过敏症状越来越多的原因除了遗传易感性,生活方式的改变也起到了重要的影响,包括剖腹产的增加、抗生素的使用和饮食生活习惯的发展等等。儿童在成长期间并未充分接触周围环境的微生物,因此缺乏相应抗原的刺激,导致后期发生过敏性疾病的概率大大增加。这些元素都直接或间接影响了肠道微生物的发展,而微生物在形成免疫反应方面发挥着主导作用,特别是在早期的时候。
[0004]肠道微生物是人体组成不可缺少的部分,不仅帮助人体从食物中吸收营养,还在包括物质代谢、生物屏障、免疫调控和宿主防御等功能上发挥重要的作用。而肠道微生物与人体存在的共生和协同进化的关系,可以促进宿主免疫系统的发育及调节机体免疫系统平衡。越来越多研究表明了肠道微生物和过敏性疾病之间存在密切的关系,例如患有过敏性鼻炎的婴儿与正常婴儿相比较在出生1个月时,肠道内肠球菌与双歧杆菌的数量都比较低,而到了12月龄时,患有过敏性鼻炎的儿童肠道内拟杆菌数量明显低于同期正常儿童。
[0005]越早干预,预防或者减轻过敏性疾病的效果就越好,而如何有效的识别预测过敏,是目前临床迫切需要解决的问题。目前常用的过敏检测方式有:血清检测,通过检测血清中IgE的浓度,来判定一些过敏性皮肤病的发生;皮肤点刺试验,以少量过敏原施予皮下注射,或于特定的皮肤位置上做表皮刮擦,辨识和确认。然而,通过血清或皮肤点刺检测的方式,检测覆盖的物质有限,并非所有过敏原都能查出,目前常见的过敏原已经近3000种,而且这些方式会对机体有一定程度的伤害,特别是对于儿童等人群。
[0006]尽管研究表明了肠道微生物和免疫疾病之间的关联作用,如何从机器学习模型上获取肠道微生物和过敏之间的关系还缺乏研究。

技术实现思路

[0007]专利技术目的:针对现有技术需求,本专利技术提供了一种基于肠道微生物的过敏预测模型构建方法,通过机器学习模型获取肠道微生物和过敏之间的关联。
[0008]技术方案:为了解决上述技术问题,本专利技术提供了一种基于肠道微生物信息的过敏预测模型构建方法,包括以下步骤:
[0009]步骤一,对受试者的过敏性病史和临床表征信息进行收集,采集受试者的粪便样本,保留过敏性病史和临床表征信息完整的受试者样本,通过基因测序方式,获取肠道微生物原始序列数据;
[0010]步骤二,对于基因测序获取的原始序列数据,首先对序列进行质量控制,去除低质量的序列和接头序列;然后进行数据降噪处理,并去除序列嵌合体,最后再对肠道微生物进行注释分析,从而筛选出肠道微生物的物种组成表;
[0011]步骤三,将筛选后的微生物物种整合形成特征变量,选择最优的特征变量合集,构建预测模型,并对各个模型预测效果进行比较,选择出最优过敏预测模型。
[0012]进一步,步骤一所述过敏性病史包括过敏性皮肤炎、过敏性鼻炎、喘息以及食物过敏。
[0013]进一步,步骤一对受试者的粪便样本DNA进行提取,并利用16S rRNA基因扩增子测序技术、宏基因组测序技术或微生物qPCR实验分析进行测序,从而获取受试者的肠道微生物原始序列数据。
[0014]进一步,步骤二使用Trimmomatic对序列进行质量控制。
[0015]进一步,步骤二使用DADA2分析流程、QIIME2分析流程或USEARCH的OTU分析流程进行降噪处理。
[0016]进一步,步骤二利用去除重复的ASV代表序列与SILVA数据库进行物种注释分析,使用RDP Classifier算法获得了物种注释结果。
[0017]更进一步,利用物种注释结果,计算属水平的各物种在样本中的相对丰度值,从而获得物种相对丰度表,过滤掉在属水平中属于unclassified的物种,仅保留属水平的物种。
[0018]进一步,步骤三选择最优的特征变量合集包括以下步骤:
[0019](1)根据随机抽样的方式,构建过敏预测模型的训练集和测试集;
[0020](2)利用递归特征消除算法来选择最终构建模型的微生物特征变量:
[0021]a、使用训练集的所有微生物作为初始子集输入随机森林分类器中,计算每个微生物的重要性并进行排序,并利用交叉验证方法得到初始子集的分类精度;
[0022]b、从初始子集中移除重要性最低的一个微生物,得到一个新的微生物子集,再次输入到随机森林分类器中,计算新子集中每个微生物的重要性,同样用交叉验证方法得到新的子集的分类精度;
[0023]c、递归的重复b步骤,最后得到各个不同微生物数量的子集,子集的总量与初始子集的微生物数量相等,比较选择分类精度最高的微生物子集作为最优微生物组合。
[0024]进一步,步骤三构建的预测模型包括glment模型、plr模型、svmLinear模型、rf模型和XGBoost模型,并对所有模型的精确度和灵敏性进行综合评估,选择最优过敏预测模型。
[0025]有益效果:本专利技术利用了机器学习的方式来建立预测过敏的模型,只需要获取受试者的粪便样本即可,不需要对受试者机体造成可能的伤害;此外,建立的基于肠道微生物菌群的预测模型,预测准确率较高,灵敏度和特异性较好,能有效的区分多个样本中过敏与否的结果,为早期预防受试者是否会发生过敏而提供有效的证据。
附图说明
[0026]图1为本专利技术过敏预测模型的构建方法流程图;
[0027]图2为不同模型精确度和灵敏性的综合评估示意图。
具体实施方式
[0028]实施例:一种基于肠道微生物信息的过敏预测模型构建方法,如图1所示,本实施例使用的编程语言主要是Python和R,按照以下步骤进行:
[0029]1、临床信息收集、过滤以及粪便样品收集
[0030]收集受试者是否有过敏性病史的信息,以及相关的临床信息数据,并采集受试者的粪便样品。对收集样本的宿主背景信息进行过滤整理,去除过敏症状不清楚的样本,只保留明确没有过敏症状以及有具体过敏症状的样本作为后续分析。最终获取使用的粪便样品来自122例受试者:表1展示了122例受试者是否有过敏性病史的相关信息,表2展示了这些过敏信息的统计结果;除了过敏信息的记录,受试者其他临床信息需要统计的类别在表3中展示。
[0031]受试者的粪便样品使用专业的采样管来收集,粪便要采集新鲜的,收集过程中避免外部环境对样本的污染,并且样本测序前要在

80℃环境下低温保存。
[0032]表1 122例受试者过敏信息详情表
[0033][0034][0035]表2 122例受试本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于肠道微生物信息的过敏预测模型构建方法,其特征在于,包括以下步骤:步骤一,对受试者的过敏性病史和临床表征信息进行收集,采集受试者的粪便样本,保留过敏性病史和临床表征信息完整的受试者样本,通过基因测序方式,获取肠道微生物原始序列数据;步骤二,对于基因测序获取的原始序列数据,首先对序列进行质量控制,去除低质量的序列和接头序列;然后进行数据降噪处理,并去除序列嵌合体,最后再对肠道微生物进行注释分析,从而筛选出肠道微生物的物种组成表;步骤三,将筛选后的微生物物种整合形成特征变量,选择最优的特征变量合集,构建预测模型,并对各个模型预测效果进行比较,选择出最优过敏预测模型。2.根据权利要求1所述的基于肠道微生物信息的过敏预测模型构建方法,其特征在于,步骤一所述过敏性病史包括过敏性皮肤炎、过敏性鼻炎、喘息以及食物过敏。3.根据权利要求1所述的基于肠道微生物信息的过敏预测模型构建方法,其特征在于,步骤一对受试者的粪便样本DNA进行提取,并利用16S rRNA基因扩增子测序技术、宏基因组测序技术或微生物qPCR实验分析进行测序,从而获取受试者的肠道微生物原始序列数据。4.根据权利要求1所述的基于肠道微生物信息的过敏预测模型构建方法,其特征在于,步骤二使用Trimmomatic对序列进行质量控制。5.根据权利要求1所述的基于肠道微生物信息的过敏预测模型构建方法,其特征在于,步骤二使用DADA2分析流程、QIIME2分析流程或USEARCH的OTU分析流程进行降噪处理。6.根据权利要求1所述的基于肠道微生物信息的过敏预测模型构...

【专利技术属性】
技术研发人员:胡万金江伟薛正晟庾庆华陈东波沈阳
申请(专利权)人:迪辅乐生物上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1