多轮对话系统的指代消解方法技术方案

技术编号：26971304 阅读：18 留言：0更新日期：2021-01-06 00:02

本发明专利技术提供的一种多轮对话系统的指代消解方法，包括以下步骤：S1.对多轮对话系统所接收到的语句进行检测，判断语句是否需要进行指代消解，如是，则进入到步骤S2中；S2.对确定为需要进行指代消解的语句进行判断，区分语句的指代类型，并从区分出指代类型的语句中筛选出候选实体；语句的指代类型包括回指语句和共指语句；S3.确定候选实体与语句中指代词的距离，并将距离最小的候选实体作为指代链接词；S4.将指代词更新为指代链接词；通过上述方法，能够对输入多轮对话系统的语句的指代进行准确的识别，并进行准确的指代消解，能有效提高多轮交互系统的顺畅性，提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
多轮对话系统的指代消解方法
本专利技术涉及人机对话语言处理领域，尤其涉及一种多轮对话系统的指代消解方法。
技术介绍
指代是一种常见的语言现象。在多轮对话系统中，指代和省略影响人机对话系统的流畅度和用户体验。人脑具有知识背景和记忆能力，能够很好的重现对话历史的关键信息，自动补全或者替换对方当前轮的代词，来理解对话的真正含义。同样，人机对话系统中需要指代消解模块，来理解用户输入的真正语义。指代消解方法分为基于管道的方法和基于端到端的方法。基于管道的方法是先进行指代检测，然后再进行指代消解。基于端到端的方法，对输入层编码，通过中间层的计算，输出指代消解结果，常见的基于端到端的方法有基于联合训练的方法、基于序列标注的方法、基于指针网络的方法。基于端到端的方法通常采用深度学习模型，但是需要大量带标签的标注数据，在面对领域数据缺乏时模型构建成本较高，尤其在初期是多轮指代消解标注数据缺乏，且在实际应用中遇到问题，模型修改迭代不满足线上系统的及时性。因此，为了解决上述技术问题，亟需提出一种新的技术手段加以解决。
技术实现思路
有鉴于此，本专利技术的目的是提供一种多轮对话系统的指代消解方法，能够对输入多轮对话系统的语句的指代进行准确的识别，并进行准确的指代消解，能有效提高多轮交互系统的顺畅性，提升用户体验。本专利技术提供的一种多轮对话系统的指代消解方法，包括以下步骤：S1.对多轮对话系统所接收到的语句进行检测，判断语句是否需要进行指代消解，如是，则进入到步骤S2中；S2.对确定为需要...

【技术保护点】
1.一种多轮对话系统的指代消解方法，其特征在于：包括以下步骤：/nS1.对多轮对话系统所接收到的语句进行检测，判断语句是否需要进行指代消解，如是，则进入到步骤S2中；/nS2.对确定为需要进行指代消解的语句进行判断，区分语句的指代类型，并从区分出指代类型的语句中筛选出候选实体；/nS3.确定候选实体与语句中指代词的距离，并将距离最小的候选实体作为指代链接词；/nS4.将指代词更新为指代链接词。/n

【技术特征摘要】
1.一种多轮对话系统的指代消解方法，其特征在于：包括以下步骤：
S1.对多轮对话系统所接收到的语句进行检测，判断语句是否需要进行指代消解，如是，则进入到步骤S2中；
S2.对确定为需要进行指代消解的语句进行判断，区分语句的指代类型，并从区分出指代类型的语句中筛选出候选实体；
S3.确定候选实体与语句中指代词的距离，并将距离最小的候选实体作为指代链接词；
S4.将指代词更新为指代链接词。

2.根据权利要求1所述多轮对话系统的指代消解方法，其特征在于：步骤S3中，根据如下方法确定候选实体与语句中指代词的距离：
D＝α*(w1*D1+w2*D2)；其中，D为候选实体与语句中指代词的距离，α为实体类型与待消解语句的类型匹配度，w1为实体与语句话题关联度系数，w2为实体替换后的句子概率系数，D1为待指代消解的语句的句向量和候选实体之间的语义距离，D2为候选实体与待指代消解语句之间的距离。

3.根据权利要求2所述多轮对话系统的指代消解方法，其特征在于：根据如下方法计算类型匹配度α：

其中，PL为指代词的指代类型的预测概率，Pm为候选实体内第m个字的字标签属性概率，k为候选实体中字的个数。

4.根据权利要求2所述多轮对话系统的指代消解方法，其特征在于：根据如下方法计算实体与语句话题关联度系数w1：
w1＝Pt；其中，Pt为当前语句的话题的前一个话题转移到当前语句的话题的概率。

5.根据权利要求2所...

【专利技术属性】
技术研发人员：张会焱，敖文刚，刘宗敏，
申请(专利权)人：重庆工商大学，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人