【技术实现步骤摘要】
基于机器学习的疾病预测方法及装置
[0001]本专利技术涉及人工智能
,尤其是涉及到基于机器学习的疾病预测方法、装置、计算机设备及计算机存储介质。
技术介绍
[0002]临床辅助医学鞠策系统(CDSS)是一种根据患者病情为医生的临床决策提供辅助建议的系统,随着医疗大数据行业的蓬勃发展,CDSS根据患者的症状、症状持续时间、历史病、用药史等信息输入模型进行预测,并将预测得到疑似的疾病提供医生参考。
[0003]考虑医疗领域的特殊性,需要模型具有较高的可解释性,目前提供解释性的方法主要使用传统机器学习的模型,且可处理的数据主要是结构化数据。然,传统机器学习的模型往往精度较低,使用效果不好,深度学习的模型具有更高的精度,而大多是黑盒模型在开发过程中并未关注如何提高可解释性,融合注意力机制的深度学习模型可提供部分可解释性,但这样的可解释性会使得模型学习到的关联关系较强,例如,患者的主诉中由咳嗽、咽痛的症状,实际被医生诊断为急性扁桃体炎,深度学习模型由于学习到“咳嗽”与“急性上呼吸道感染”的相关性很强,会推荐诊断为“急性 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的疾病预测方法,其特征在于,所述方法包括:获取样本用户的文本病例信息,并将所述样本用户的文本病例信息形成文本信息组合;将所述文本信息组合输入至包括文本编码器和因果分辨模块的网络模型中进行训练,所述文本编码器用于提取文本信息组合的向量表示,以及根据所述文本信息组合的向量表示进行疾病类别预测,所述因果矫正模块用于对所述文本信息组合中不同疾病症状之间的差异化字符进行预测;使用训练后的文本编码器构建疾病预测模型;响应于疾病预测指令,利用所述疾病预测模型对所述疾病预测指令携带目标用户的文本病例信息进行预测,输出目标用户对应的疾病类别。2.根据权利要求1所述的方法,其特征在于,所述获取样本用户的文本病例信息,并将所述样本用户的文本病例信息形成文本信息组合,具体包括:针对样本用户的文本病例信息进行标记,得到文本病例信息具有的疾病症状和疾病类别标签;选取至少两个具有不同疾病症状和相同疾病类别标签的文本病例信息,并针对不同疾病症状之间的差异化字符将选取的至少两个文本病例信息形成文本信息组合。3.根据权利要求1所述的方法,其特征在于,所述文本信息组合具有不同疾病症状和相同疾病类别标签的至少两个文本病例信息,所述至少两个文本病例信息中携带有不同疾病症状之间的差异化字符标签,所述将所述文本信息组合输入至包括文本编码器和因果分辨模块的网络模型中进行训练,具体包括:将所述文本信息组合输入至网络模型中的文本编码器进行训练,得到文本信息组合中每个文本病例信息的向量表示以及每个文本病例信息预测得到的疾病类别;将所述文本信息组合中每个文本病例信息的向量表示以及每个文本病例信息预测得到的疾病类别输入至网络模型中的因果分辨模块进行训练,得到文本信息组合中不同疾病症状之间的差异化字符;所述使用训练后的文本编码器构建疾病预测模型,具体包括:在对所述文本编码器和所述因果分辨模块训练过程中,利用所述文本病例信息的疾病类别标签和所述差异化字符标签对所述网络模型中参数进行调整;使用经过参数调整后的文本编码器构建疾病预测模型。4.根据权利要求3所述的方法,其特征在于,所述文本编码器与所述因果分辨模块在训练过程中进行对抗学习,以对所述文本信息组合的向量表示进行因果矫正,并根据矫正后的向量表示评估每个差异化字符的可解释性。5.根据权利要求3所述的方法,其特征在于,所述在对所述文本编码器和所述因果分辨模块训练过程中,利用所述文本病例信息的疾病类别标签和所述差异化字符标签对所述网络模型中参...
【专利技术属性】
技术研发人员:蒋雪涵,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。