一种基于预训练和数据分解两阶段的血糖预测方法技术

技术编号:37059336 阅读:11 留言:0更新日期:2023-03-29 19:36
本发明专利技术涉及一种基于预训练和数据分解两阶段的血糖预测方法,包括以下步骤:结合健康人群和糖尿病人群的血糖数据,开发预训练模型;采集待预测的糖尿病患者的数据;数据进行缺值补充处理和平滑处理;数据进行模态分解,分解为含有不同频率信息的固有模态分量;进行样本熵分析,对样本熵最大的分量进行二次分解;加载预训练模型的权重,导入步骤5处理过的糖尿病患者的数据至集成学习模块。本发明专利技术先结合健康人群和糖尿病人群的血糖数据,训练一个通用的血糖预测模型作为预训练模型,让模型具备预测数据储备,以解决现有血糖预测方法单一,只考虑了单个糖尿病人的血糖数据,无法很好地预测样本数据外患者的血糖浓度。好地预测样本数据外患者的血糖浓度。好地预测样本数据外患者的血糖浓度。

【技术实现步骤摘要】
一种基于预训练和数据分解两阶段的血糖预测方法


[0001]本专利技术涉及血糖预测领域,具体的说,是涉及一种基于预训练和数据分解两阶段的血糖预测方法。

技术介绍

[0002]糖尿病是由胰岛素分泌紊乱而引起的代谢性疾病,患者体内的葡萄糖无法正常吸收,长此以往会导致短期或长期的并发症,严重影响患者的生活质量和生命安全。血糖浓度是诊断糖尿病的标准,借助CGMS(连续动态血糖监测)获得患者连续的血糖数据采集,再进行血糖预测。
[0003]血糖预测方式中常见的一类是基于数据驱动模型的方式,该方式仅考虑患者的血糖数据,利用近期的血糖值,结合算法预测未来一段时间的血糖浓度变化,例如Sandham提出的递归神经网络,Bremer提出的自回归模型,Fayrouz提出采用自反馈神经网络的方法,Georga利用支持向量机算法,莫雪等人利用极限学习机算法,李宁等人利用回声状态网络建立起血糖混沌预报模型等。利用上述算法可以建立血糖预测模型,利用患者数据进行算法验证,获得较为准确的实验结果。此方式仅利用患者历史血糖数据进行血糖预测,不需要考虑其他生理因素。
[0004]目前血糖预测都只采用上述其中一个模型,单一的方法泛化能力较弱,且大多只考虑了单个糖尿病人的血糖数据,无法很好地预测样本数据外患者的血糖浓度。
[0005]以上问题,值得解决。

技术实现思路

[0006]为了克服现有技术的问题:血糖预测只采用一个模型,且只考虑单个糖尿病人的血糖数据,泛化能力较弱,无法很好地预测样本数据外患者的血糖浓度,本专利技术提供一种基于预训练和数据分解两阶段的血糖预测方法。
[0007]本专利技术技术方案如下所述:
[0008]一种基于预训练和数据分解两阶段的血糖预测方法,包括以下步骤:
[0009]S1、结合健康人群和糖尿病人群的血糖数据,开发预训练模型;
[0010]S2、采集待预测的糖尿病患者的数据;
[0011]S3、对步骤2的数据进行缺值补充处理和平滑处理;
[0012]S4、对步骤3所得的数据进行模态分解,分解为一系列含有不同频率信息的固有模态分量;
[0013]S5、对步骤4分解得到的模态分量进行样本熵分析,对样本熵最大的分量进行二次分解;
[0014]S6、加载步骤1的预训练模型的权重,导入步骤5处理过的糖尿病患者的数据至集成学习模块,所述集成学习模块用于预测未来30分钟和未来60分钟的血糖值。
[0015]根据上述方案的本专利技术,步骤1包括以下步骤:
[0016]S101、导入第一数据库,第一数据库的样本包括糖尿病人群的血糖数据和健康人群的血糖数据;
[0017]其中,第一数据库的数据包括低血糖风险(LBGI)和高血糖风险(HBGI);
[0018]LBGI的算法是对血糖监测结果进行统计学转化,根据转化结果计算低血糖风险,然后计算所有低血糖风险值的平均值,公式如下:
[0019][0020]HBGI算法是对血糖监测结果进行统计学转化,根据转化结果计算高血糖风险,然后计算所有高血糖风险值的平均值,公式如下:
[0021][0022]fbgi=1.509
×
(log(BG)
1.084

5.381);
[0023]公式中,fbgi为转化后的血糖值,n为血糖测量总数。
[0024]低血糖风险与高血糖风险的和作为风险指数(Risk Index),即有:
[0025]Risk Index=LBGI+HBGI。
[0026]S102、筛选出过去30分钟、过去1小时、过去2小时、过去4小时和过去8小时的历史血糖数据;
[0027]S103、将筛选出的血糖数据送入LSTM模型,将训练结果保存为权重文件,作为预训练模型,用作后续训练模型的默认参数;
[0028]其中,LSTM主要通过三个门:忘记门(遗忘门)、输入门、输出门,来达到信息的传递的作用;忘记门通过上一隐藏层和当前输入层通过一个sigmoid单元决定忘记上一轮记忆的细胞信息的多少,即有:f
t
=σ(W
xf
x
t
+W
hf
h
t
‑1+b
f
);
[0029]输入门有个sigmoid单元决定输入信息、输出比例,即有:i
t
=σ(x
t
W
xi
+h
t
‑1W
hi
+b
i
);
[0030]输入信息通过tanh单元得到,即有:
[0031]经过门控的作用真实的输入信息为细胞信息是通过上一轮残留下来的信息和当前获取到的信息共同决定的,所以即:
[0032]c
t
=f
t
c
t
‑1+i
t
*tanh(x
t
W
xc
+h
t
‑1W
hc
+b
c
);
[0033]获取细胞信息通过tanh单元得到隐藏输出层信息,同时有个输出们通过sigmoid单元控制输出量,有:
[0034]o
t
=σ(x
t
W
xo
+h
t
‑1W
ho
+c
t
‑1W
co
+b
o
);
[0035]h
t
=o
t
tanh(c
t
);
[0036]最终输出为:
[0037]进一步的,步骤S101中的血糖数据为连续50天的血糖动态监测数据;其样本的群体包括若干名儿童、若干名青少年和若干名成年人。
[0038]根据上述方案的本专利技术,步骤2包括以下步骤:
[0039]S201、采集待预测糖尿病患者的历史血糖数据,作为第二数据库;
[0040]S202、导入第二数据库。
[0041]进一步的,步骤S201的采集血糖数据要求包括:血糖检测仪器必须在连续7天中至少采集4天;必须收集至少96小时的动态血糖监测数据,其中至少有24小时是过夜(即晚上
10点到早上6点)。
[0042]更进一步的,第二数据库的样本为一型糖尿病患者的血糖数据,样本群体的年龄在3.5~17.7岁,平均年龄9.9岁。
[0043]根据上述方案的本专利技术,步骤3包括以下步骤:
[0044]S301、利用数据缺值补充法处理含有缺失值的病患血糖数据;
[0045]S302、利用数据平滑滤波法使血糖数据平滑。
[0046]进一步的,数据缺值补充法包括双线性插值和线性外推,数据平滑滤波法包括卡尔曼滤波、中值滤波。
[0047]根据上述方案的本专利技术,步骤4包括以下步骤:
[0048本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于预训练和数据分解两阶段的血糖预测方法,包括以下步骤:S1、结合健康人群和糖尿病人群的血糖数据,开发预训练模型;S2、采集待预测的糖尿病患者的数据;S3、对步骤2的数据进行缺值补充处理和平滑处理;S4、对步骤3所得的数据进行模态分解,分解为一系列含有不同频率信息的固有模态分量;S5、对步骤4分解得到的模态分量进行样本熵分析,对样本熵最大的分量进行二次分解;S6、加载步骤1的预训练模型的权重,导入步骤5处理过的糖尿病患者的数据至集成学习模块,所述集成学习模块用于预测未来30分钟和未来60分钟的血糖值。2.根据权利要求1所述的基于预训练和数据分解两阶段的血糖预测方法,其特征在于,步骤1包括以下步骤:S101、导入第一数据库,第一数据库的样本包括糖尿病人群的血糖数据和健康人群的血糖数据;S102、筛选出过去30分钟、过去1小时、过去2小时、过去4小时和过去8小时的历史血糖数据;S103、将筛选出的血糖数据送入LSTM模型,将训练结果保存为权重文件,作为预训练模型,用作后续训练模型的默认参数。3.根据权利要求2所述的基于预训练和数据分解两阶段的血糖预测方法,其特征在于,步骤S101中的血糖数据为连续50天的血糖动态监测数据;样本的群体包括若干名儿童、若干名青少年和若干名成年人。4.根据权利要求1所述的基于预训练和数据分解两阶段的血糖预测方法,其特征在于,步骤2包括以下步骤:S201、采集待预测糖尿病患者的历史血糖数据,作为第二数据库;S202、导入第二数据库。5.根据权利要求4所述的基于预训练和数据分解两阶段的血糖预测方法,其特征在于,步骤S201的采集血糖数据要求包括:血糖检测仪器必须在连续7天中至少采集4天;必须收集...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:深圳可孚生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1