基于分段域RF建模预测血糖的方法、系统及存储介质技术方案

技术编号:33295320 阅读:18 留言:0更新日期:2022-05-01 00:23
本发明专利技术提出一种基于分段域RF建模预测血糖的方法、系统及存储介质,涉及无创血糖预测的技术领域,采集志愿者的实际血糖值数据及同步的相关生理特性参数数据,形成特征矩阵,然后将特征矩阵作为数据集,并根据个体饮食结构变化划分为训练集和测试集,利用血糖的分布特性确定血糖区间集中的段数,对训练集划分段域,构建不同分段域的随机森林模型,再对测试集的每一组数据对应的特征求加权欧氏距离,并分类归于不同的随机森林模型,划分段域后得出的血糖预测值更准确,与实际血糖参考值误差更小,拟合程度较好,且实现在饮食结构变化的情况下仍能对血糖进行有效的监测,使血糖预测的准确度更高,便于糖尿病患者在生活中对血糖的积极自我干预。积极自我干预。积极自我干预。

【技术实现步骤摘要】
基于分段域RF建模预测血糖的方法、系统及存储介质


[0001]本专利技术涉及无创血糖预测的
,更具体地,涉及一种基于分段域RF建模预测血糖的方法、系统及存储介质。

技术介绍

[0002]糖尿病是因为胰岛素分泌绝对或相对不足引起的以空腹或餐后高血糖为主要表现的代谢异常综合症,极易引发全身各种急、慢性并发症,是危害人类健康的一大杀手,而目前医学上并没有方法可以完全根治,因此,对血糖的监测就显得至关重要。
[0003]在糖尿病人的生活中,若能积极地人为干预体内的血糖水平,有利于自身血糖水平的正常维持,基于此,目前,有创血糖检测仪应用比较广泛,但有创血糖检测仪的使用不仅使患者存在血液感染的风险,而且会造成患者心理和生理上的痛苦,使患者产生抵触感,为患者在生活中自行干预体内的血糖水平带来较多麻烦。为满足患者实现无痛检测血糖的需求,目前使用近红外光谱进行无创血糖检测是最有前景的方式,该方式将近红外光采集得到的信号用于血糖预测。
[0004]随机森林(Random Forest,简称RF)是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,可用来预测疾病的风险和病患者的易感性,在血糖预测的领域,目前常用的方式是将无创采集得到的信号与有创血糖参考值处理得出的特征矩阵作为数据集,将其进行划分训练集与测试集后,利用训练集在随机森林中训练出的一个模型,将剩余的测试集放进训练好的模型中得出预测值。如现有技术中公开了一种基于饮食习惯预测糖尿病的模型构建方法,所述的模型即为决策树模型,首先获取包括样本多日餐食的食材信息的第一样本集,然后抽取第一样本集中的若干个数据,将该数据作为特征组成第二样本集,将所述第二样本集划分为训练集、验证集,将所述训练集作为决策树模型器的输入,训练所述决策树模型,直至特征的信息增益低于阈值,得到决策树模型,最后利用这种决策树模型进行糖尿病风险预测,但该方案一方面未结合正常人体的饮食规律状态下血糖变化规律,可靠性较低,另一方面,准确、有效、可靠的血糖预测模型是实现血糖精准预测的关键,该方案中基于单一模型的预测,对血糖的预测准确度也较低。

技术实现思路

[0005]为解决当前采用基于单一模型预测血糖的方式,导致血糖预测准确度低的问题,本专利技术提出一种基于分段域RF建模预测血糖的方法、系统及存储介质,在个人饮食结构变化的前提下合理预测血糖,并保证了精确度,进一步为临床治疗提供参考。
[0006]为了达到上述技术效果,本专利技术的技术方案如下:
[0007]一种基于分段域RF建模预测血糖的方法,包括:
[0008]S1.确定志愿者群体,采集志愿者的实际血糖值数据以作为血糖参考值,且采集志愿者同步的相关生理特征参数数据;
[0009]S2.基于相关生理特征参数数据与实际血糖数据构建特征矩阵,将特征矩阵作为
数据集,并划分为训练集和测试集;
[0010]S3.将血糖参考值从低至高排序,形成分布区间,与血糖参考值同步的相关生理特征参数数据也按相同顺序排序;
[0011]S4.根据标准血糖变化规律、个体饮食结构以及每天的数据采集时间段确定血糖区间集中的段数N,将排序后的血糖参考值及与血糖参考值同步的相关生理特征参数数据形成的训练集也划分为N段域;
[0012]S5.构建N段域训练集分别对应的N个随机森林模型RF并训练,得到训练好的训练随机森林模型RF;
[0013]S6.求解测试集中每一组数据在每一个随机森林模型RF中的贡献值,基于贡献值求解测试集的每一组数据对应于每一个随机森林模型RF的加权欧氏距离,根据加权欧氏距离将测试集中的每一组数据分类归属于对应的随机森林模型RF;
[0014]S7.在对应的随机森林模型RF中对测试集中的每一组数据进行血糖预测,得到血糖预测结果。
[0015]优选地,在步骤S1中,设定数据整体采集时长为T,结合个体饮食结构以及标准血糖变化规律,设定每天的数据采集时间段为早餐前、午餐后、晚餐前以及晚餐后四个时段,设定饮食结构变化的三个阶段数据采集周期,每个阶段为期T/3天,第一阶段为“正常饮食”阶段,第二阶段为“生酮饮食”阶段,第三阶段为“餐后喝可乐”阶段;采集志愿者的实际血糖值数据时采用有创血糖检测方法;所述的相关生理特征参数数据包括:PPG心电信号、ECG脉电信号、血压、心率,采用无创方式采集。
[0016]在此,考虑不同的个体在进食同种结构、同种食物后会产生不一样的反应,即血糖指标存在对个体的差异性,而且相同的食物在不同个体之间的血糖反应差异很大,除了食物本身的特征外,个体对食物产生的血糖反应可能受到生理因素、遗传因素以及其他因素的影响,如身高体重、身体素质、消化吸收功能等,因此分别采集个人的相关不同生理特征参数数据以及考虑饮食结构的变化,可以有效避免因个体差异对血糖指标的影响,提升血糖预测结果的准确度,便于糖尿病患者在生活中的积极自我干预。
[0017]优选地,在步骤S2中,构建的特征矩阵中设有反映人体生理特性的特征值和血糖特征值,其中,反映人体生理特性的特征值包括PPG心电信号和ECG脉电信号、根据ECG脉电信号提取的波形特征、同步的血压、心率、心跳变异特征,血糖特征值即实际血糖值数据。
[0018]所述的训练集为“正常饮食”阶段采集的志愿者的实际血糖值数据和同步的相关生理特征参数数据,所述的测试集为“生酮饮食”阶段和“餐后喝可乐”阶段采集的志愿者的实际血糖值数据和同步的相关生理特征参数数据,“正常饮食”阶段、“生酮饮食”阶段和“餐后喝可乐”阶段采集的志愿者的实际血糖值数据作为血糖参考值。基于三种不同饮食习惯进行三个阶段的实验,以便实现在饮食结构变化的情况下仍能对血糖进行有效的监测,使血糖预测的准确度更高,更具有实际意义。
[0019]优选地,在步骤S3中,设血糖参考值表示为[BG1,BG2,

,BG
K
]序列,K表示采集的实际血糖值数据总个数,将[BG1,BG2,

,BG
K
]序列的每一个血糖参考值从低至高排序,形成分布区间,得到[BG
min


,BG
max
],其中,BG
max
表示排序后的血糖参考值最大值,BG
min
排序后的血糖参考值最小值。
[0020]优选地,在步骤S5中,N个随机森林模型RF通过自助法重采样技术构建,利用
bootstrap法从N个训练集中分别有放回地重复随机抽取k个训练集样本生成新的训练集样本,对于每个新的训练集样本都建立决策树,形成N个随机森林模型RF,构建完成后,依次将训练集数据输入随机森林模型RF,每一个随机森林模型RF的每颗决策树的预测结果作为一次预测投票,以少数服从多数作为预测结果;根据多个预测结果和实际血糖参考值的误差确定随机森林模型RF的精度,将精度与精度设置值对比,对随机森林模型RF进行调整,直至随机森林模型RF的精度达到精度设置值。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分段域RF建模预测血糖的方法,其特征在于,包括:S1.确定志愿者群体,采集志愿者的实际血糖值数据以作为血糖参考值,且采集志愿者同步的相关生理特征参数数据;S2.基于相关生理特征参数数据与实际血糖数据构建特征矩阵,将特征矩阵作为数据集,并划分为训练集和测试集;S3.将血糖参考值从低至高排序,形成分布区间,与血糖参考值同步的相关生理特征参数数据也按相同顺序排序;S4.根据标准血糖变化规律、个体饮食结构以及每天的数据采集时间段确定血糖区间集中的段数N,将排序后的血糖参考值及与血糖参考值同步的相关生理特征参数数据形成的训练集也划分为N段域;S5.构建N段域训练集分别对应的N个随机森林模型RF并训练,得到训练好的训练随机森林模型RF;S6.求解测试集中每一组数据在每一个随机森林模型RF中的贡献值,基于贡献值求解测试集的每一组数据对应于每一个随机森林模型RF的加权欧氏距离,根据加权欧氏距离将测试集中的每一组数据分类归属于对应的随机森林模型RF;S7.在对应的随机森林模型RF中对测试集中的每一组数据进行血糖预测,得到血糖预测结果。2.根据权利要求1所述的基于分段域RF建模预测血糖的方法,其特征在于,在步骤S1中,设定数据整体采集时长为T,结合个体饮食结构以及标准血糖变化规律,设定每天的数据采集时间段为早餐前、午餐后、晚餐前以及晚餐后四个时段,设定饮食结构变化的三个阶段数据采集周期,每个阶段为期T/3天,第一阶段为“正常饮食”阶段,第二阶段为“生酮饮食”阶段,第三阶段为“餐后喝可乐”阶段;采集志愿者的实际血糖值数据时采用有创血糖检测方法;所述的相关生理特征参数数据包括:PPG心电信号、ECG脉电信号、血压、心率,采用无创方式采集。3.根据权利要求2所述的基于分段域RF建模预测血糖的方法,其特征在于,在步骤S2中,构建的特征矩阵中设有反映人体生理特性的特征值和血糖特征值,其中,反映人体生理特性的特征值包括PPG心电信号和ECG脉电信号、根据ECG脉电信号提取的波形特征、同步的血压、心率、心跳变异特征,血糖特征值即实际血糖值数据。所述的训练集为“正常饮食”阶段采集的志愿者的实际血糖值数据和同步的相关生理特征参数数据,所述的测试集为“生酮饮食”阶段和“餐后喝可乐”阶段采集的志愿者的实际血糖值数据和同步的相关生理特征参数数据,“正常饮食”阶段、“生酮饮食”阶段和“餐后喝可乐”阶段采集的志愿者的实际血糖值数据作为血糖参考值。4.根据权利要求3所述的基于分段域RF建模预测血糖的方法,其特征在于,在步骤S3中,设血糖参考值表示为[BG1,BG2,

,BG
K
]序列,K表示采集的实际血糖值数据总个数,将[BG1,BG2,

,BG
K
]序列的每一个血糖参考值从低至高排序,形成分布区间,得到[BG
min


,BG
max
],其中,BG
max
表示排序后的血糖参考值最大值,BG
min
排序后的血糖参考值最小值。5.根据权利要求4所述的基于分段域RF建模预测血糖的方法,其特征在于,在步骤S5中,N个随机森林模型RF通过自助法重采样技术构建,利用bootstrap法从N个训练集中分别有放回地重复随机抽取k个训练集样本生成新的训练集样本,对于每个新的训练集样本都
建立决策树,形成N个随机森林模型RF,构建完成后,依次将训练集数据输入随机森林模型RF,每一个随机森林模型RF的每颗决策树的预测结果作为一次预测投票,以少数服从多数作为预...

【专利技术属性】
技术研发人员:韦怡婷黄宇轩凌永权刘庆胡铃越郑小奔
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1