【技术实现步骤摘要】
一种基于深度强化学习的问诊方法及系统
[0001]本专利技术属于智能诊断
,尤其涉及一种基于深度强化学习的问诊方法。
技术介绍
[0002]在医疗领域,由于医疗资源有限,医疗资源压力过大,以及患者对大医院的盲目 信任等原因,长期存在挂号难就医难的问题。具体表现为,大医院三甲医院门庭若市, 而小医院门可罗雀,使得有限的医疗资源没有得到最大的利用。
[0003]随着信息技术的发展,为了减少医疗资源压力、承担初步筛查导诊责任,远程线 上问诊应运而生。通过远程线上问诊,患者可以足不出户就在互联网上与远方的医生 以文本、音频、视频的形式进行交流,得到诊断服务。这种服务一定程度上减缓了不 同地域之间医疗资源不平衡的现状,医生可以通过与患者远程线上会诊来判断患者病 情轻重,推荐病人小病去小医院、大病去大医院,最大限度利用好公共医疗资源,起 到合理规划医疗资源的效果。
[0004]然而,远程线上问诊本身没有提升医疗资源总量,提供远程线上问诊服务的医生 只是将自己的休息时间或是工作时间放在了线上问诊上,医生的总数并没有发 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的问诊方法,其特征在于:其包括:根据患者自诉及历史问诊数据提取到症状文本,并根据预设的标准症状词典进行归一化从而得到标准化症状文本,将其输入问诊模型中的症状问询模块,所述症状问询模块利用医疗知识库,根据得到的标准化症状文本通过深度强化学习进行关联推理,向患者进行下一步的症状询问,用以得到更多症状信息;重复上述过程,直至诊断模型判定已得到了足够的信息或无法从患者处得到更多信息时结束症状询问并通过问诊模型中的诊断模块做出最终诊断;其中,所述问诊模型对问诊对话的症状文本进行编码并聚合得到症状文本集合表示;根据症状文本集合表示,输出在目前已知信息条件下的疾病预测概率分布,通过深度神经网络架构对症状集合表示进行实时诊断预测;所述问诊模型基于历史问诊数据进行深度强化学习训练,所述问诊模型还包括症状问询模块和疾病诊断模块,所述症状问询模块将问诊过程视为序列决策问题进行建模,使用基于价值函数的无模型强化学习方法Q
‑
Learning进行解决,所述疾病诊断模块将实时诊断视为分类问题进行建模,使用梯度提升决策树进行解决。2.根据权利要求1所述的基于深度强化学习的问诊方法,其特征在于:所述问诊模型包括:基于上下文的文本表示模型将症状文本序列的每个字向其他字进行注意力交互,通过改良的Transformer编码器对症状文本进行编码获得症状文本表示,通过拼接聚合或平均聚合将所有症状文本表示向量进行聚合,将各个症状信息融合得到整个症状集合的向量表示,通过注意力机制学习整个症状文本集合的表示。3.根据权利要求2所述的基于深度强化学习的问诊方法,其特征在于:所述问诊模型采用如下方法进行训练:设计病人模拟器的输入输出规则,从问诊记录数据集中采样得到当前病人记录并与对话策略模型交互,得到模拟问诊对话数据,对问诊模型进行学习;采用实时诊断概率分布对病人模拟器反馈的奖励函数进行加权指导,提升模型对于候选症状的召回能力。4.根据权利要求3所述的基于深度强化学习的问诊方法,其特征在于:对所述症状文本集合,采用两阶段预训练
‑
微调方法,引入预训练语料中学习的信息,并在目标数据集上进行二次预训练,融入更多症状文本信息;针对症状询问,采用奖励函数,在给定轮数下,实现最大化症状召回率;所述奖励函数为常数奖励函数、归一化奖励函数、先验条件概率奖励函数或实时诊断奖励函数;所述实时诊断奖励函数为对疾病进行实时诊断,使用该次动作前后目标疾病上实时诊断概率之差进行加权。5.基于深度强化学习的问诊系统,其特征在于:其包括:症状询问模块,根据患者自诉及历史问诊数据提取到症状文本,并根据预设的标准症状词典进行归一化从而得到标准化症状文本,将其输入问诊模型中的症状问询模块,所述症状问询模块利用医疗知识库,根据得到的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。