一种半监督的多轮医疗对话回复生成方法及系统技术方案

技术编号：30153340 阅读：50 留言：0更新日期：2021-09-25 15:03

本发明专利技术属于对话式信息处理领域，提供了一种半监督的多轮医疗对话回复生成方法及系统。其中，该方法包括将第一轮对话中病人的问题输入至半监督医疗对话模型，得到第一轮对话的回复；在第二轮及其后对话中，将当前轮病人的问题及上一轮对话的回复输入至半监督医疗对话模型中，得到相应轮对话的回复，直至病人无新的问题输入；半监督医疗对话模型包括上下文编码器、先验状态追踪器、推理策略状态追踪器、先验策略网络、推理策略网络和回复生成器，上下文编码器用于对接收到的信息进行编码并输入至先验状态追踪器和先验策略网络中，先验状态追踪器用于不断追踪用户的身体状态，先验策略网络用于生成医师动作，回复生成器用于根据身体状态及医师动作，生成对应的回复。生成对应的回复。生成对应的回复。

全部详细技术资料下载

【技术实现步骤摘要】
一种半监督的多轮医疗对话回复生成方法及系统

[0001]本专利技术属于对话式信息处理领域，尤其涉及一种半监督的多轮医疗对话回复生成方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]同时为了解决开放领域的信息需求和高度垂直领域的专业需求，会话范式被用来将人们与信息联系起来。现有的对话系统可分为两大类：面向任务的和开放域对话系统。以任务为导向的对话系统旨在帮助人们完成特定的任务。例如日程安排，订餐馆，查询天气。开放域对话系统主要是与人们聊天，用于满足人们对信息和娱乐的需求。不同于医疗问答，真实医学场景中的对话更可能包含多轮交互。因为患者需要通过对话的上下文来表达他/她的症状、他/她正在服用的药物和他/她的病史。这一特性使得显式状态追踪变得不可或缺，其提供了比隐状态表示更具指示性和可解释性的信息。考虑到医学对话的特殊性，医学推理能力(例如是否开药，开什么药治疗疾病，询问何种症状)也是医疗诊断中不可或缺的特性。
[0004]现有的医疗对话方法是基于任务导向的对话范式构建，遵循的是患者表达症状的，对话系统返回诊断结果(即确定病人患了什么疾病)的范式。其取得了很好的效果。但这些方法只聚焦于诊断这一单一领域，无法满足实际应用中病人的多种需求，而且其需要大量人工标注的状态和动作。当对话数据高度机密或数据规模巨大时是无法实现的，并且这些工作受限于训练数据规模的影响，甚至无法使用生成式的方法来生成回复，只能通过模板的方式来组成回复。一些任务型对话...

【技术保护点】

【技术特征摘要】
1.一种半监督的多轮医疗对话回复生成方法，其特征在于，包括：将第一轮对话中病人的问题输入至半监督医疗对话模型，得到第一轮对话的回复；在第二轮及其后对话中，将当前轮病人的问题及上一轮对话的回复输入至半监督医疗对话模型中，得到相应轮对话的回复，直至病人无新的问题输入；其中，半监督医疗对话模型包括上下文编码器、先验状态追踪器、推理策略状态追踪器、先验策略网络、推理策略网络和回复生成器，上下文编码器用于对接收到的信息进行编码并输入至先验状态追踪器和先验策略网络中，先验状态追踪器用于不断追踪用户的身体状态，先验策略网络用于生成医师动作，回复生成器用于根据身体状态及医师动作，生成对应的回复；推理状态追踪器用于推理出用户的身体状态，推理策略网络用于推理出医师动作；推理状态追踪器和推理策略网络仅仅只在半监督医疗对话模型的训练阶段执行。2.如权利要求1所述的半监督的多轮医疗对话回复生成方法，其特征在于，推理状态追踪器和推理策略网络均是编码器
‑
解码器结构。3.如权利要求1所述的半监督的多轮医疗对话回复生成方法，其特征在于，先验状态追踪器和先验策略网络均是编码器
‑
解码器结构。4.如权利要求1所述的半监督的多轮医疗对话回复生成方法，其特征在于，回复生成器是一个基于GRU的解码器。5.如权利要求1所述的半监督的多轮医疗对话回复生成方法，其特征在于，采用监督数据和无监督数据来训练半监督医疗对话模型。6.如权利要求5所述的半监督的多轮医疗对话回复生成方法，其特征在于，无监督数据的训练损失函数被拆分成L
s
和L
a
两个训练目标，最小化L
s
提升模型状态追踪性能，第二阶段最小化L
s
+L<...

【专利技术属性】
技术研发人员：任昭春，任鹏杰，陈竹敏，李冬冬，马军，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人