膳食方案反应性预测模型及建模方法、电子设备技术

技术编号:24999500 阅读:26 留言:0更新日期:2020-07-24 18:01
本发明专利技术公开一种膳食方案反应性预测模型及建模方法、电子设备,所述膳食方案反应性预测模型的建模方法,包括如下步骤:S101:采集训练数据并进行预处理,所述采集训练数据并进行预处理的方法包括:采集代谢疾病患者的指标和膳食信息数据;通过评价代谢疾病患者的指标得到膳食方案效果;以及通过分析膳食方案效果筛选出显著影响因素;S102:设置XGBoost的训练参数;S103:以显著影响因素和膳食信息数据作为模型的输入,以膳食方案效果作为模型的输出,基于XGBoost算法采用十折交叉验证法对模型进行训练;S104:使用步骤S103中训练好的模型进行预测。本发明专利技术建立的预测模型能够辅助医生形成更有效的膳食方案,提高膳食干预效果。

【技术实现步骤摘要】
膳食方案反应性预测模型及建模方法、电子设备
本专利技术涉及生物医学工程技术与营养健康领域,具体涉及一种膳食方案反应性预测模型及建模方法。
技术介绍
膳食对代谢疾病的预防和治疗的作用不容忽视,研究表明合适的膳食可以改善代谢疾病的血糖、血压和血脂情况。但是目前医生开具的膳食方案存在如下问题:(1)膳食方案的效果不可控,医生在开具膳食方案之前,只清楚该膳食方案可以改善患者的代谢情况,但不清楚这种膳食方案可以改善到什么程度。(2)目前的膳食方案无法做到有针对性,针对同种疾病的患者,医生开具的膳食方案可能是一样的,但由于个体其他条件的差异,实际产生的效果是不一样的,因此对于同种膳食方案,有些患者的改善效果很好,有些患者的改善效果很差。(3)膳食方案过于粗放,医生按照指南开具的是规定用户该吃哪些食物、不该吃哪些食物,未能具体量化患者的更多膳食信息,诸如脂肪、碳水化合物、糖、咖啡因、酒精等指标的含量以及评价这些膳食信息对干预效果的影响。因此,亟待开发一种预测模型,能够针对不同的患者做到有针对性的膳食方案。
技术实现思路
为了使医生对开具的膳食方案的效果可以预测,本专利技术的提供一种膳食方案反应性预测模型及建模方法、电子设备。根据本专利技术的第一方面,本专利技术公开一种膳食方案反应性预测模型的建模方法,包括如下步骤:S101:采集训练数据并进行预处理,所述采集训练数据并进行预处理的方法包括:采集训练用的代谢疾病患者的指标和膳食信息数据;通过评价代谢疾病患者的指标得到膳食方案效果;以及通过分析膳食方案效果筛选出显著影响因素;其中,所述代谢疾病患者的指标包括一般指标、综合评估指标和代谢指标;S102:设置XGBoost的训练参数;S103:以显著影响因素和膳食信息数据作为模型的输入,以膳食方案效果作为模型的输出,基于XGBoost算法采用十折交叉验证法对模型进行训练;S104:使用步骤S103中训练好的模型进行预测。根据本专利技术的一示例实施方式,所述一般指标包括年龄、性别、受教育程度和疾病史,所述一般指标在给定膳食方案周期开始前采集。根据本专利技术的一示例实施方式,所述综合评估指标包括临床指标和膳食习惯,所述临床指标包括:性别、心率、身高、吸烟史、饮酒史、家族史、既往疾病史、心电图、超声心动图、实验室检查结果以及临床合并症,所述膳食习惯包括:调查患者的宗教饮食属性、就餐规律程度、饮水量、零食习惯、用盐量、用油量、乳品食用情况、豆制品食用情况、肉类食用情况、蔬菜食用情况和主食食用情况,所述综合评估指标分别在给定膳食方案周期开始前和给定膳食方案周期结束后采集。根据本专利技术的一示例实施方式,所述代谢指标包括空腹血糖、舒张压、收缩压、总胆固醇、甘油三酯和体重,所述代谢指标分别在给定膳食方案周期开始前和给定膳食方案周期结束后采集。根据本专利技术的一示例实施方式,所述膳食信息数据包括酒精含量、咖啡因含量、碳水化合物含量、膳食纤维、摄入能量、脂肪、蛋白质、钠、糖、水以及碳水化合物与脂肪的比率,所述膳食信息数据在给定膳食方案周期内每天进行采集。其中,酒精含量、碳水化合物含量、膳食纤维、脂肪、蛋白质、糖和水的单位均为克,咖啡因含量和钠的单位均为毫克,摄入能量的单位为卡路里。根据本专利技术的一示例实施方式,所述给定膳食方案周期为1个月以上。根据本专利技术的一示例实施方式,通过评价代谢疾病患者的指标得到膳食方案效果的方法包括:基于给定膳食方案周期开始和给定膳食方案周期结束的代谢指标变化情况,评价膳食方案效果为有效或无效,满足一下所有条件则认为膳食方案有效,反之则认为膳食方案无效:如果患有糖尿病时,给定膳食方案周期结束时的空腹血糖值低于给定膳食方案周期开始时的空腹血糖值且降低超过给定血糖阈值;如果患有高血压时,给定膳食方案周期结束时的血压低于给定膳食方案周期开始时的血压,且收缩压至少降低给定收缩压阈值和舒张压至少降低给定舒张压阈值,其中所述血压包括收缩压和舒张压;如果患血脂异常时,给定膳食方案周期结束时的血脂低于给定膳食方案周期开始时的血脂,且总胆固醇至少降低给定总胆固醇阈值和甘油三酯至少降低给定甘油三酯阈值,其中所述血脂包括总胆固醇和甘油三酯;如果肥胖或超重时,给定膳食方案周期结束时的体重低于给定膳食方案周期开始时的体重,且控制在正常水平,且至少降低给定体重阈值。根据本专利技术的一示例实施方式,所述通过分析膳食方案效果筛选出显著影响因素的方法包括:基于单变量分析筛选法分析代谢疾病患者的指标,对于服从正态分布的数据采用独立T检验,对于不服从正态分布的数据采用Wilconxon秩和检验。在构建模型之前,面临的第一步往往就是降维,或者说筛选特征。单变量分析筛选法的主要思路就是根据统计检验的方法分别对每个变量进行检验,然后排序选择分数最高的那些特征。根据本专利技术的一示例实施方式,所述设置XGBoost的训练参数的内容包括:树的最大深度设置为6;学习率设为0.3;学习目标定义为:膳食方案有效定义为1,膳食方案无效定义为0;迭代次数设置为50棵。根据本专利技术的一示例实施方式,所述基于XGBoost算法采用十折交叉验证法对模型进行训练的方法包括:采用XGBoost算法生成一个分类树的集合,每个分类树利用十折交叉验证法进行训练,将对应每棵树的叶子节点得分相加,对第i个样本的特征计算出预测估计值,建立目标函数,再将机器学习模型输出的预测估计值经过四舍五入后定义为膳食方案效果的有无。其中,i为1到n的自然数,n表示训练用的代谢疾病患者的样本数量,n为大于或等于1000的自然数。为了充分利用样本及确保算法的准确性,采用十折交叉验证法将n例患者的数据集分成十份,分为训练集和测试集,轮流将其中的9份作为训练数据,1份作为测试数据进行试验。根据本专利技术的一示例实施方式,所述对第i个样本的特征计算出的预测估计值的计算公式如公式1所示:公式1其中,fk表示每一棵回归树的预测结果,K为回归树的数量,xi表示第i个样本的特征,yi表示第i个样本的预测估计值,公式1表示给定一个输入值xi,输出值为K棵回归树的预测估计值yi;第t次迭代的目标函数如公式2所示:公式2其中,l是一个可以微分的损失函数,yi,yi~(t-1)表示第t-1次迭代中第i个样本的实际值与预测值yi之间的差异,ft(xi)是经过第t次迭代后第i个样本的预测结果,Ω(ft)是复杂度的惩罚函数,用来避免过拟合,t为大于1的自然数。根据本专利技术的一示例实施方式,所述使用步骤S103中训练好的模型进行预测的方法包括:采集需要预测的代谢疾病患者的指标和膳食信息数据;从需要预测的代谢疾病患者的指标中筛选出显著影响因素;和将需要预测的代谢疾病患者的显著影响因素和膳食信息数据输入训练好的模型中,得到膳食方案反应性预测结果。根据本专利技术的第二方面,本专利技术公开一种膳食方案反应性预测模型,包括:训练数据采集模块,所述训练数据采集模块与本文档来自技高网...

【技术保护点】
1.一种膳食方案反应性预测模型的建模方法,其特征在于,包括如下步骤:/nS101:采集训练数据并进行预处理,所述采集训练数据并进行预处理的方法包括:采集训练用的代谢疾病患者的指标和膳食信息数据;通过评价代谢疾病患者的指标得到膳食方案效果;以及通过分析膳食方案效果筛选出显著影响因素;其中,所述代谢疾病患者的指标包括一般指标、综合评估指标和代谢指标;/nS102:设置XGBoost的训练参数;/nS103:以显著影响因素和膳食信息数据作为模型的输入,以膳食方案效果作为模型的输出,基于XGBoost算法采用十折交叉验证法对模型进行训练;/nS104:使用步骤S103中训练好的模型进行预测。/n

【技术特征摘要】
1.一种膳食方案反应性预测模型的建模方法,其特征在于,包括如下步骤:
S101:采集训练数据并进行预处理,所述采集训练数据并进行预处理的方法包括:采集训练用的代谢疾病患者的指标和膳食信息数据;通过评价代谢疾病患者的指标得到膳食方案效果;以及通过分析膳食方案效果筛选出显著影响因素;其中,所述代谢疾病患者的指标包括一般指标、综合评估指标和代谢指标;
S102:设置XGBoost的训练参数;
S103:以显著影响因素和膳食信息数据作为模型的输入,以膳食方案效果作为模型的输出,基于XGBoost算法采用十折交叉验证法对模型进行训练;
S104:使用步骤S103中训练好的模型进行预测。


2.根据权利要求1所述的膳食方案反应性预测模型的建模方法,其特征在于,所述一般指标包括年龄、性别、受教育程度和疾病史,所述一般指标在给定膳食方案周期开始前采集;
所述综合评估指标包括临床指标和膳食习惯,所述临床指标包括:心率、身高、吸烟史、家族史、既往疾病史、心电图、超声心动图、实验室检查结果以及临床合并症,所述膳食习惯包括:调查患者的宗教饮食属性、就餐规律程度、饮水量、零食习惯、用盐量、用油量、乳品食用情况、豆制品食用情况、肉类食用情况、蔬菜食用情况以及主食食用情况,所述综合评估指标分别在给定膳食方案周期开始前和给定膳食方案周期结束后采集;
所述代谢指标包括空腹血糖、舒张压、收缩压、总胆固醇、甘油三酯和体重,所述代谢指标分别在给定膳食方案周期开始前和给定膳食方案周期结束后采集;
所述膳食信息数据包括酒精含量、咖啡因含量、碳水化合物含量、膳食纤维、摄入能量、脂肪、蛋白质、钠、糖、水以及碳水化合物有与脂肪的比率,所述膳食信息数据在给定膳食方案周期内的每天进行采集。


3.根据权利要求1所述的膳食方案反应性预测模型的建模方法,其特征在于,所述通过评价代谢疾病患者的指标得到膳食方案效果的方法包括:基于给定膳食方案周期开始和给定膳食方案周期结束的代谢指标变化情况,评价膳食方案效果为有效或无效,满足以下所有条件则认为膳食方案有效,反之则认为膳食方案无效:
如果患有糖尿病时,给定膳食方案周期结束时的空腹血糖值低于给定膳食方案周期开始时的空腹血糖值且降低超过给定血糖阈值,
如果患有高血压时,给定膳食方案周期结束时的血压低于给定膳食方案周期开始时的血压,且收缩压至少降低给定收缩压阈值和舒张压至少降低给定舒张压阈值,其中所述血压包括收缩压和舒张压,
如果患血脂异常时,给定膳食方案周期结束时的血脂低于给定膳食方案周期开始时的血脂,且总胆固醇至少降低给定总胆固醇阈值和甘油三酯至少降低给定甘油三酯阈值,其中所述血脂包括总胆固醇和甘油三酯,
如果肥胖或超重时,给定膳食方案周期结束时的体重低于给定膳食方案周期开始时的体重,且控制在正常水平,且至少降低给定体重阈值。


4.根据权利要求1所述的膳食方案反应性预测模型的建模方法,其特征在于,所述通过分析膳食方案效果筛选出显著影响因素的方法包括:基于单变量分析筛选法分析代谢疾病患者的指标,对于服从正态分布的数据采用独立T检验,对于不服从正态分布的数据采用Wilconxon秩和检验。


5.根据权利要求1所述的膳食方案反应性预测模型的建模方法,其特征在于,所述基于XGBoost算法采用十折交叉验证法对模型进行训练的方法包括:
采用XGBoost算法生成一个分类树的集合,每个分...

【专利技术属性】
技术研发人员:张永亮叶骏高向阳
申请(专利权)人:北京动亮健康科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1