当前位置: 首页 > 专利查询>山东大学专利>正文

一种半监督的多轮医疗对话回复生成方法及系统技术方案

技术编号:30153340 阅读:50 留言:0更新日期:2021-09-25 15:03
本发明专利技术属于对话式信息处理领域,提供了一种半监督的多轮医疗对话回复生成方法及系统。其中,该方法包括将第一轮对话中病人的问题输入至半监督医疗对话模型,得到第一轮对话的回复;在第二轮及其后对话中,将当前轮病人的问题及上一轮对话的回复输入至半监督医疗对话模型中,得到相应轮对话的回复,直至病人无新的问题输入;半监督医疗对话模型包括上下文编码器、先验状态追踪器、推理策略状态追踪器、先验策略网络、推理策略网络和回复生成器,上下文编码器用于对接收到的信息进行编码并输入至先验状态追踪器和先验策略网络中,先验状态追踪器用于不断追踪用户的身体状态,先验策略网络用于生成医师动作,回复生成器用于根据身体状态及医师动作,生成对应的回复。生成对应的回复。生成对应的回复。

【技术实现步骤摘要】
一种半监督的多轮医疗对话回复生成方法及系统


[0001]本专利技术属于对话式信息处理领域,尤其涉及一种半监督的多轮医疗对话回复生成方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]同时为了解决开放领域的信息需求和高度垂直领域的专业需求,会话范式被用来将人们与信息联系起来。现有的对话系统可分为两大类:面向任务的和开放域对话系统。以任务为导向的对话系统旨在帮助人们完成特定的任务。例如日程安排,订餐馆,查询天气。开放域对话系统主要是与人们聊天,用于满足人们对信息和娱乐的需求。不同于医疗问答,真实医学场景中的对话更可能包含多轮交互。因为患者需要通过对话的上下文来表达他/她的症状、他/她正在服用的药物和他/她的病史。这一特性使得显式状态追踪变得不可或缺,其提供了比隐状态表示更具指示性和可解释性的信息。考虑到医学对话的特殊性,医学推理能力(例如是否开药,开什么药治疗疾病,询问何种症状)也是医疗诊断中不可或缺的特性。
[0004]现有的医疗对话方法是基于任务导向的对话范式构建,遵循的是患者表达症状的,对话系统返回诊断结果(即确定病人患了什么疾病)的范式。其取得了很好的效果。但这些方法只聚焦于诊断这一单一领域,无法满足实际应用中病人的多种需求,而且其需要大量人工标注的状态和动作。当对话数据高度机密或数据规模巨大时是无法实现的,并且这些工作受限于训练数据规模的影响,甚至无法使用生成式的方法来生成回复,只能通过模板的方式来组成回复。一些任务型对话的方法可以应用于医疗对话中的状态追踪,但是其依旧无法应对无充分标注数据的情景。为了减轻任务导向对话系统对于数据标注的需求,Jin等和Zhang等都使用了半监督的学习方法来进行状态追踪,但忽视了对话主体的推理能力,即未建模医师的动作。Liang等提出一种利用未完全标注的数据来训练任务导向对话系统中的特定模块的方法,但是无法在训练时刻推理出未标注的标签,致使其在医疗对话系统中同时无状态和动作标注的情况下提升有限。专利技术人发现,这些方法都未考虑从大规模医疗知识中进行检索,未能生成富含知识的回复,在医学对话这种对于推理能力有很强需求的场景中表现很差。

技术实现思路

[0005]为了解决上述
技术介绍
中存在的技术问题,本专利技术提供一种半监督的多轮医疗对话回复生成方法及系统,其同时考虑了病人状态和医师动作,使得对话系统同时具备了建模用户身体状态和医学推理的能力。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]本专利技术的第一个方面提供一种半监督的多轮医疗对话回复生成方法。
[0008]一种半监督的多轮医疗对话回复生成方法,其包括:
[0009]将第一轮对话中病人的问题输入至半监督医疗对话模型,得到第一轮对话的回复;
[0010]在第二轮及其后对话中,将当前轮病人的问题及上一轮对话的回复输入至半监督医疗对话模型中,得到相应轮对话的回复,直至病人无新的问题输入;
[0011]其中,半监督医疗对话模型包括上下文编码器、先验状态追踪器、推理状态追踪器、先验策略网络、推理策略网络和回复生成器,上下文编码器用于对接收到的信息进行编码并输入至先验状态追踪器和先验策略网络中,先验状态追踪器用于不断追踪用户的身体状态,先验策略网络用于生成医师相应的动作,回复生成器用于根据身体状态及医师动作,生成对应的回复;
[0012]推理状态追踪器用于推理出用户的身体状态,推理策略网络用于推理出医师动作;推理状态追踪器和推理策略网络仅仅只在半监督医疗对话模型的训练阶段执行。
[0013]本专利技术的第二个方面提供一种半监督的多轮医疗对话回复生成系统。
[0014]一种半监督的多轮医疗对话回复生成系统,其包括:
[0015]第一轮对话回复生成模块,其用于将第一轮对话中病人的问题输入至半监督医疗对话模型,得到第一轮对话的回复;
[0016]第二轮及其后对话回复生成模块,其用于在第二轮及其后对话中,将当前轮病人的问题及上一轮对话的回复输入至半监督医疗对话模型中,得到相应轮对话的回复,直至病人无新的问题输入;
[0017]其中,半监督医疗对话模型包括上下文编码器、先验状态追踪器、推理状态追踪器、先验策略网络、推理策略网络和回复生成器,上下文编码器用于对接收到的信息进行编码并输入至先验状态追踪器和先验策略网络中,先验状态追踪器用于不断追踪用户的身体状态,先验策略网络用于生成医师相应的动作,回复生成器用于根据身体状态及医师动作,生成对应的回复;
[0018]推理状态追踪器用于推理出用户的身体状态,推理策略网络用于推理出医师动作;推理状态追踪器和推理策略网络仅仅只在半监督医疗对话模型的训练阶段执行。
[0019]本专利技术的第三个方面提供一种计算机可读存储介质。
[0020]一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的半监督的多轮医疗对话回复生成方法中的步骤。
[0021]本专利技术的第四个方面提供一种计算机设备。
[0022]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的半监督的多轮医疗对话回复生成方法中的步骤。
[0023]与现有技术相比,本专利技术的有益效果是:
[0024](1)本专利技术在第二轮及其后对话中,将当前轮病人的问题及上一轮对话的回复输入至半监督医疗对话模型中,得到相应轮对话的回复,直至病人无新的问题输入,显式建模了用户的身体状态以及医师的动作,使用text span来进行表示,提升了模型对于病人生理状态建模和医疗推理的能力。
[0025](2)本专利技术在模型层面,将用户的身体状态和医师动作当做隐变量,并且提出了存
在中间标注(即监督)和不存在中间标注(即无监督)的情况下,模型的训练方法。该方法大大减小了对话模型对于标注数据的依赖。
[0026](3)本专利技术提出在策略网络学习的过程中,使用追踪到的病人状态从大规模医疗知识图谱中进行检索,显式的状态,动作和医疗知识图谱中的推理路径提升了对话系统生成回复的可解释性。
[0027](4)在模型训练上,本专利技术提出了两阶段层叠推理的方法,提升了监督训练数据较少的情况下的稳定性。
[0028]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0029]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0030]图1(a)是本专利技术实施例的监督数据训练;
[0031]图1(b)是本专利技术实施例的无监督数据训练;
[0032]图1(c)是本专利技术实施例的测试阶段使用的模块;
[0033]图2是本专利技术实施例的医疗对话系统具体实施方法;
[0034本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种半监督的多轮医疗对话回复生成方法,其特征在于,包括:将第一轮对话中病人的问题输入至半监督医疗对话模型,得到第一轮对话的回复;在第二轮及其后对话中,将当前轮病人的问题及上一轮对话的回复输入至半监督医疗对话模型中,得到相应轮对话的回复,直至病人无新的问题输入;其中,半监督医疗对话模型包括上下文编码器、先验状态追踪器、推理策略状态追踪器、先验策略网络、推理策略网络和回复生成器,上下文编码器用于对接收到的信息进行编码并输入至先验状态追踪器和先验策略网络中,先验状态追踪器用于不断追踪用户的身体状态,先验策略网络用于生成医师动作,回复生成器用于根据身体状态及医师动作,生成对应的回复;推理状态追踪器用于推理出用户的身体状态,推理策略网络用于推理出医师动作;推理状态追踪器和推理策略网络仅仅只在半监督医疗对话模型的训练阶段执行。2.如权利要求1所述的半监督的多轮医疗对话回复生成方法,其特征在于,推理状态追踪器和推理策略网络均是编码器

解码器结构。3.如权利要求1所述的半监督的多轮医疗对话回复生成方法,其特征在于,先验状态追踪器和先验策略网络均是编码器

解码器结构。4.如权利要求1所述的半监督的多轮医疗对话回复生成方法,其特征在于,回复生成器是一个基于GRU的解码器。5.如权利要求1所述的半监督的多轮医疗对话回复生成方法,其特征在于,采用监督数据和无监督数据来训练半监督医疗对话模型。6.如权利要求5所述的半监督的多轮医疗对话回复生成方法,其特征在于,无监督数据的训练损失函数被拆分成L
s
和L
a
两个训练目标,最小化L
s
提升模型状态追踪性能,第二阶段最小化L
s
+L<...

【专利技术属性】
技术研发人员:任昭春任鹏杰陈竹敏李冬冬马军
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1