应用于糖尿病预测的CNN-BiLSTM-Attention融合模型训练方法技术

技术编号：40108781 阅读：16 留言：0更新日期：2024-01-23 18:50

本发明专利技术公开应用于糖尿病预测的CNN‑BiLSTM‑Attention融合模型训练方法，获得糖尿病数据并进行预处理，构建数据集，将数据集按预设比例划分为训练集和测试集；将训练集输入至CNN‑BILSTM‑Attention融合模型中采用Adam算法进行训练，直至达到迭代次数或满足预设要求，获得训练好的CNN‑BILSTM‑Attention融合模型，所述CNN‑BILSTM‑Attention融合模型包括CNN层，用于获取局部信息；BILSTM层，用于提取数据时序特征；注意力层和全连接层，用于输出预测结果。本发明专利技术有助于辅助医生诊断与预测糖尿病患者，降低致死率，并为糖尿病防控提供重要的支持。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及糖尿病预测，尤其涉及一种应用于糖尿病预测的cnn-bilstm-attention融合模型训练方法。

技术介绍

1、糖尿病是一种具有遗传特征的慢性疾病，早发现早治疗可以有效降低其致死概率。因此，设计一种高效准确的糖尿病预测模型对辅助医生诊断有重要意义。

2、随着机器学习的深度应用，在糖尿病预测领域已经出现了很多优秀的预测模型，包括传统的机器学习和神经网络基于网络的预测模型。常用传统机器学习方法，如：逻辑回归、决策树、随机森林。基于此还有融合模型的方法，对多种传统机器学习进行staking集成，融合模型的效果也比单个模型更优。基于神经网络的预测模型则有一维卷积神经网络的方法。但是存在以下问题：1)实验采用的是小样本数据集，便于采集，医院检测成本低，这也造成相应的预测模型轻量化；2)模型输入数据形式单一，维度简单，随着数据量的增加，糖尿病患者数据量更大，维度更高，传统机器学习方法和简单的神经网络方法并不能很好的实现糖尿病患病预测。

技术实现思路

1、为了解决上述技术问题，本专利技术一种提出应用于糖尿病预测的cnn-bilstm-attention融合模型训练方法，为了更好地处理大数据量，并选择与之匹配的预测模型，cnn模块挖掘更深层次信息特征；bilstm模块能在处理时序序列上发挥作用，提取输入数据的时序信息。此外，融合模型的处理效率较单一模型有所提高，attention机制在模型输出前进行动态赋权，对更重要的序列赋予更高的权重，可以提供更好的预测精度。>

2、为了达到上述目的，本专利技术的技术方案如下：

3、应用于糖尿病预测的cnn-bilstm-attention融合模型训练方法，包括如下步骤：

4、获得糖尿病数据并进行预处理，构建数据集，将数据集按预设比例划分为训练集和测试集；

5、将训练集输入至cnn-bilstm-attention融合模型中采用adam算法进行训练，迭代更新参数，直至达到迭代次数或满足预设要求，获得训练好的cnn-bilstm-attention融合模型，所述cnn-bilstm-attention融合模型包括依次连接的cnn模块、bilstm模块、注意力层和全连接层，其中，所述cnn层，用于获取局部信息；所述bilstm层，用于提取数据时序特征；所述注意力层和全连接层，用于输出预测结果；

6、将测试集输入训练好的cnn-bilstm-attention融合模型中，采用评价指标对模型性能进行评估。

7、优选地，所述预处理，包括如下步骤：

8、对糖尿病数据进行填补缺失值操作和归一化处理；

9、使用卡方检验函数分析初始特征与预测目标之间的关联性，确定具有显著关联的前k个特征；

10、对显著关联的前k个特征进行数据标准化处理。

11、优选地，所述前k个特征包括葡萄糖、胰岛素、bmi、年龄。

12、优选地，所述cnn模块采用一维卷积神经网络，其一维卷积神经网络的神经元数量设置为8，所述bilstm模块中隐藏的神经元数量为16。

13、优选地，所述bilstm模块后连接dropout层，所述dropout层的丢弃概率为0.3。

14、优选地，采用二进制交叉熵作为模型的损失函数。

15、优选地，所述评价指标包括精确率、准确率、f1和mcc。

16、基于上述技术方案，本专利技术的有益效果是：本专利技术应用于糖尿病预测的cnn-bilstm-attention融合模型训练方法，获得糖尿病数据并进行预处理，构建数据集，将数据集按预设比例划分为训练集和测试集；将训练集输入至cnn-bilstm-attention融合模型中采用adam算法进行训练，直至达到迭代次数或满足预设要求，获得训练好的cnn-bilstm-attention融合模型，所述cnn-bilstm-attention融合模型包括依次连接的cnn模块、bilstm模块、注意力层和全连接层，其中，所述cnn层，用于获取局部信息；所述bilstm层，用于提取数据时序特征；所述注意力层和全连接层，用于输出预测结果；将测试集输入训练好的cnn-bilstm-attention融合模型中，采用评价指标对模型性能进行评估。本专利技术首层选取卷积神经网络架构能够处理大容量数据并为接下来的bilstm模块减少参数量，提高模型运行效率同时增加了模型输入的多样性，在模型构建的最后选取注意力机制能够动态融合特征序列，同时增加了模型的可解释性，使用时更易懂。模型评估中选取了mcc指标，能更全面的检测模型性能，改善模型性能。最终，提高cnn-bilstm-attention融合模型针对糖尿病的预测精度。

本文档来自技高网...

【技术保护点】

1.应用于糖尿病预测的CNN-BiLSTM-Attention融合模型训练方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的应用于糖尿病预测的CNN-BiLSTM-Attention融合模型训练方法，其特征在于，所述预处理，包括如下步骤：

3.根据权利要求2所述的应用于糖尿病预测的CNN-BiLSTM-Attention融合模型训练方法，其特征在于，所述前K个特征包括葡萄糖、胰岛素、BMI、年龄。

4.根据权利要求1所述的应用于糖尿病预测的CNN-BiLSTM-Attention融合模型训练方法，其特征在于，所述CNN模块采用一维卷积神经网络，其一维卷积神经网络的神经元数量设置为8，所述BiLSTM模块中隐藏的神经元数量为16。

5.根据权利要求4所述的应用于糖尿病预测的CNN-BiLSTM-Attention融合模型训练方法，其特征在于，所述BiLSTM模块后连接Dropout层，所述Dropout层的丢弃概率为0.3。

6.根据权利要求1所述的应用于糖尿病预测的CNN-BiLSTM-Attention融合模型

7.根据权利要求1所述的应用于糖尿病预测的CNN-BiLSTM-Attention融合模型训练方法，其特征在于，所述评价指标包括精确率、准确率、F1和MCC。

...

【技术特征摘要】

1.应用于糖尿病预测的cnn-bilstm-attention融合模型训练方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的应用于糖尿病预测的cnn-bilstm-attention融合模型训练方法，其特征在于，所述预处理，包括如下步骤：

3.根据权利要求2所述的应用于糖尿病预测的cnn-bilstm-attention融合模型训练方法，其特征在于，所述前k个特征包括葡萄糖、胰岛素、bmi、年龄。

4.根据权利要求1所述的应用于糖尿病预测的cnn-bilstm-attention融合模型训练方法，其特征在于，所述cnn模块采用一维卷积神经网络，其一维卷积神经网络...

【专利技术属性】
技术研发人员：刘慧舟，杜星泽，黄梦醒，冯思玲，毋媛媛，张雨，
申请(专利权)人：海南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人