当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于DBA-MALSTMFCN的EC保育患者风险预警模型的方法技术

技术编号:39056875 阅读:17 留言:0更新日期:2023-10-12 19:50
本发明专利技术公开了一种基于DBA

【技术实现步骤摘要】
一种基于DBA

MALSTMFCN的EC保育患者风险预警模型的方法


[0001]本专利技术属于疾病风险预测领域,涉及一种基于DBA

MALSTMFCN的EC保育患者风险预警模型的方法,具体预测子宫内膜癌及非典型增生参与保育治疗患者经过保育治疗3个月后是否得到缓解。

技术介绍

[0002]人工智能的应用主要分为两大类。第一类包括机器学习技术,分析结构化数据,对患者特征进行聚类,从而预测疾病结局的概率。第二类包括从非结构化数据(如临床笔记和患者病历)中提取信息的自然语言处理方法,以补充和丰富结构化医疗数据。自然语言处理将文本转换为机器可读的结构化数据,然后机器学习技术可以对这些数据进行分析。MALSTM

FCN是一种结合了多层注意力长短期记忆网络(MultipleAttentionLSTM,MALSTM)和一维卷积神经网络(1DCNN)的深度学习模型。MALSTM是一种注意力机制的长短期记忆网络,用于处理序列数据。与传统的LSTM不同,MALSTM引入了注意力机制,使得模型能够自动学习并关注输入序列中的关键部分。这样可以提高模型对重要信息的抓取能力,并更好地处理长期依赖关系。FCN是一种卷积神经网络的结构,常用于处理图像和序列数据。1DCNN是FCN的一种变体,专门设计用于处理一维序列数据。它利用一维卷积操作来提取序列中的局部特征,并通过池化层和全连接层进行特征融合和分类。MALSTM

FCN结合了MALSTM和1DCNN的优点,旨在充分利用注意力机制和卷积操作来处理序列数据。它能够自适应地学习序列中的重要部分,并捕捉局部特征,从而提高序列数据的建模和分类性能。总结来说,MALSTM

FCN是一种结合了多层注意力长短期记忆网络和一维卷积神经网络的深度学习模型,用于处理序列数据分析任务。因此选取MALSTM

FCN算法来构建分类模型来提高时间序列数据的分类准确率。
[0003]动态时间规整(DynamicTimeWarping,DTW)由Itakura提出,是一种衡量两个长度不同的时间序列的相似度的方法,这里的相似性即时间序列间的距离。对于时间序列间距离的计算,比较传统的方法是计算欧几里得距离,但当时间序列比较复杂时,如不同的语音时间序列存在时间长度不同的现象,利用欧几里得距离计算所得的间距不够准确,相比于这种方法,DTW算法能够在复杂的时间序列中更准确地求得两个时间序列之间的距离。这是由于DTW算法能够对时间序列在时间轴上进行扭曲,使得两个时间序列达到更好的对齐,从而更准确地得到两个时间序列的距离。DBA算法是在DTW算法基础上进行的,是一种全局平均算法,通过多次迭代,不断跟新平均时间序列,最终使得平均时间序列与时间序列集中的其他序列的平方距离(DTW)之和最小。由DBA算法的原理可知,该算法可以用于计算一个时间序列数据集的平均时间序列,即可以将一个原始的时间序列集合进行平均从而得到一个合成的新的时间序列。实际上,目前已有研究将DBA算法应用于时间序列数据增强,如Fawaz等采用DBA算法对时间序列样本进行增强,从而获得了更多新的时间序列样本。基于这个思想,利用DBA算法来合成小样本数据,解决原始子宫内膜癌保育患者数据过少的问题。
[0004]MICE通过一系列迭代的预测模型来“填充”(插补)数据集中的缺失数据。在每次迭
代中,将使用数据集中的其他变量来估算数据集中的每个指定的变量,这些迭代持续运行,直到满足收敛为止。使用MICE对数据进行缺失值处理,保证数据的完整性。
[0005]构建的DBA

MALSTMFCN模型在技术实现时,分为模型训练阶段和模型应用阶段。模型训练阶段是指MALSTM

FCN算法对训练数据进行学习以训练模型的阶段;模型应用阶段是指利用训练好的模型对新数据进行预测。

技术实现思路

[0006]本专利技术评估子宫内膜癌保育患者经保育治疗后疾病是否得到缓解,提出了一种基于DBA

MALSTMFCN的EC保育患者风险预警模型的方法。
[0007]本专利技术是通过以下技术方案实现的:1)对子宫内膜癌保育患者的基本情况、高危因素、医院实验室检查及辅助检查数据和诊断结果等数据进行处理;2)对数据进行缺失值处理以及对数据进行数据增强;3)使用MALSTM

FCN构建时间序列分类模型;4)利用数据对模型进行训练,得到最优超参数;5)通过测试数据检验模型的有效性和准确性。
附图说明
[0008]图1是基于DBA算法的数据合成流程图;图2是MLSTM

FCN架构图;图3是Squeeze

and

excitationblock图;图4是基于DBA

MALSTMFCN的EC患者保育治疗预警模型图;图5是不同模型结果对比图;
具体实施方式
[0009]下面结合具体实施方式对本专利技术对本专利技术做进一步的详细说明:1.数据处理:得到的原始数据包括子宫内膜癌及子宫内膜非典型增生患者的基本情况、高危因素、医院实验室及辅助检查数据和诊断结果,利用机器学习对时间序列的患者数据中的文本病历进行结构化处理,将其中的非结构化数据处理为模型可以识别的结构化数据,以及其他数字信息进行数据提取,并将得到的不同数据进行整合后生成数据收集表。使用pandas对数据进行清洗、准备和数据规整,通过Matplotlib构建折线图对患者数据进行探索性分析,可以清楚地展示变量随时间的变化趋势;2.缺失值处理:通过MICE对数据进行缺失值处理,通过一系列迭代的预测模型来“填充”(插补)数据集中的缺失数据。3.数据增强:通过DBA对数据集进行数据增强,利用DBA算法来合成小样本数据,解决原始子宫内膜癌保育患者数据过少的问题,从而提高模型预测精度。4.模型构建和参数选取:利用MALSTM

FCN构成多变量时间序列分类模型,通过LSTM平行预测已经进行保育治疗的患者下个阶段(三个月后)的各项指标后,重新构建EC保育患者数据集,使用MALSTM

FCN进行分类,评估EC患者经保育治疗后疾病是否缓解,并且画出患者保育治疗后各项指标走势图。MALSTM

FCN模型使用时间卷积网络(TCN)作为FCN分支的特征提取模块。MALSTM是一种注意力机制的长短期记忆网络,用于处理序列数据。与传统的LSTM不同,MALSTM引入了注意力机制,使得模型能够自动学习并关注输入序列中的关键
部分。这样可以提高模型对重要信息的抓取能力,并更好地处理长期依赖关系。FCN是一种卷积神经网络的结构,常用于处理图像和序列数据。利用数据对模型进行训练,利用传统手工搜索方式,通过训练算法手动检查随机超参数集,并选择符合目标的最佳参数。5.模型测试:通过测试数据检验模型有效性和准确性,采取K折交叉验证将数据分为大小相同的K个分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DBA

MALSTMFCN的EC保育患者风险预警模型的方法,其特征在于:将参与保育治疗的患者四个阶段的基本情况、高危因素和医院实验室检查及辅助检查数据以及诊断结果等时间序列数据进行处理,得到患者数据后搭建模型,训练模型,最后评估模型效能,包括以下步骤:步骤1:根据研究内容,对时间序列数据进行预处理;步骤2:对数据的缺失值进行插值处理以及对数据集进行数据增强处理;步骤3:根据递归神经网络的研究成果,搭建网络模型;步骤4:通过数据训练优化模型参数,并通过测试数据检验模型有效性和准确性。2.根据权利要求1所述的一种基于DBA

MALSTMFCN的EC保育患者风险预警模型的方法,其特征在于:步骤1对时间序列的患者数据中的文本病历进行结构化处理,以及其他数字信息进行数据提取,并使用pandas对数据进行清洗、准备和数据规整,通过Matplotli...

【专利技术属性】
技术研发人员:孙悦李智杨帆李欣阳朱玉龙
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1