一种基于自编码器的肝病评估方法技术

技术编号：22365551 阅读：41 留言：0更新日期：2019-10-23 05:10

本发明专利技术公开了一种基于自编码器的肝病评估方法，该方法包括以下步骤：采集肝病患者医疗门诊数据；对数据进行预处理，处理过程采用离散标准化进行处理；然后用自编码器进行特征提取，并加入数据相关系数改进原有自编码器并将其命名为关联自编码器。最后为分类器训练，根据关联自编码器提取的特征来训练分类器，获得病人所患肝病种类的概率。本发明专利技术能解决传统自编码器没有考虑数据样本之间关系导致的特征提取能力不足的问题，并且能够发现肝病数据的深层关系使得类别之间的特征区分更加明显，从而提高分类器的分类准确率进而提高肝病评估的效果。

A liver disease evaluation method based on self encoder

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自编码器的肝病评估方法
本专利技术涉及一种基于自编码器的肝病评估方法，属于大数据医疗

技术介绍
肝病是指发生在肝脏的病变，是一种常见的危害性极大的疾病，它具有感染人群广、危害性巨大、种类繁多的特点。如果能够指定一套完整的规范来及时准确的评估病情从而指定相应的救治方案，这将对肝病的治疗和预防产生重要影响。近年来深度学习和数据挖掘领域的兴起让人们意识到挖掘出医疗数据深层次的特征，可以有效地提高医学数据的利用率，减少患者的就诊时间并提高医生的行医效率和评估的准确率。现有技术中，深度学习已经广泛应用到了医疗领域并取得了不错的成效，其中自编码器网络作为深度学习网络之一也在被不断的改进和完善。然而传统自编码器提取的特征没有考虑到数据样本之间的关系，这可能会导致信息的丢失，而且肝病数据本身具有一定的相关性，因此如果不考虑数据之间的关系将会影响到最终的分类效果。
技术实现思路
针对现有技术中存在的问题，本专利技术提出了一种基于自编码器的肝病评估方法，利用改进的自编码器提取门诊数据特征，并根据提取的特征对其进行正确的分类来达到评估的目的。为实现上述专利技术目的，本专利技术提供了一种基于自编码器的肝病评估方法，包括以下步骤：1)对医院的肝病门诊数据进行采集、汇总；2)对采集的门诊数据进行预处理，包括缺失值的填充、噪声的过滤、无效数据的清除；3)将预处理过的门诊数据输入到关联自编码器中进行训练来提取门诊数据的特征；4)将经过关联自编码器提取的特征输入到softmax分类器中训练并对模型进行整体的反向传播调整和优化；5)将测试数据输入到训练好的关联自编码器和和sof...

【技术保护点】
1.一种基于自编码器的肝病评估方法，其特征为，包括以下步骤：1)对医院的肝病门诊数据进行采集、汇总；2)对采集的门诊数据进行预处理，包括缺失值的填充、噪声的过滤、无效数据的清除；3)将预处理过的门诊数据输入到关联自编码器中进行训练来提取门诊数据的特征；4)将经过关联自编码器提取的特征输入到softmax分类器中训练并对关联自编码器和softmax分类器进行整体的微调；5)将测试数据输入到训练好的关联自编码器和和softmax分类器模型中进行评估测试，分类器的结果即为肝病的评估结果。

【技术特征摘要】
1.一种基于自编码器的肝病评估方法，其特征为，包括以下步骤：1)对医院的肝病门诊数据进行采集、汇总；2)对采集的门诊数据进行预处理，包括缺失值的填充、噪声的过滤、无效数据的清除；3)将预处理过的门诊数据输入到关联自编码器中进行训练来提取门诊数据的特征；4)将经过关联自编码器提取的特征输入到softmax分类器中训练并对关联自编码器和softmax分类器进行整体的微调；5)将测试数据输入到训练好的关联自编码器和和softmax分类器模型中进行评估测试，分类器的结果即为肝病的评估结果。2.如权利要求1所述的一种基于自编码器的肝病评估方法，其特征为，所述步骤3)中关联自编码器训练提取门诊数据特征包括以下步骤：3.1)将预处理后的门诊数据转换成一个矩阵，矩阵的每一行即为一个病人的门诊数据，用向量X来表示一个病人的门诊数据；每个特征与关联自编码器的输入层单元一一对应；3.2)关联自编码器训练过程如下：3.2.1)将样本数据X输入到输入层，用sigmoid激活函数得出隐含层数据的输出；隐含层的输出为Y＝s(w1X+b1)，其中w1、b1分别为输入层到隐含层的权重和偏置项，第一轮训练时w1和b1通过随机初始化得到，之后通过随机梯度下降法不断调整；3.2.2)输出层数据由隐含层通过sigmoid激活函数获得，输出层的输出为X'＝s(w2Y+b2)，其中隐含层到输出层的权重w2和偏置项b2在第一轮训练时也是通过随机初始化获得，之后通过随机梯度下降法不断调整，Y为隐含层的输出；3.2.3)计算输入层X和输出层X'的相关系数其中Cov(X,X')为X和X'的协方差，D表示方差；协方差的计算方式如下：Cov(X,X')＝E(XX')-E(X)E(X')3.2.4)将相关系数加入自编码器目标函数中组成关联自编码器，关联自编码器的损失函数为：3.2.5)采用随机梯度下降法进行反向传播训练，更新输入层到隐含层和隐含层到输出层的权重w1、w2和偏置b1、b2，权重和偏置的求导过程如下：权重求偏导：偏置求偏导：其中ai为每个单元的激活值，δi为每个单元的残差...

【专利技术属性】
技术研发人员：刘志锋，王康，蒋跃明，周从华，吉奕，
申请(专利权)人：江苏大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人