一种多轮问答改写方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33146550 阅读:74 留言:0更新日期:2022-04-22 13:58
本申请提供一种多轮问答改写方法、装置、电子设备及存储介质,用以提高文本改写的准确率。该方法包括:获取多轮对话中的上文数据和待改写文本;根据配置的槽位信息,从上文数据中得到先行词集合;根据预设的区间长度集合,对待改写文本进行划分处理,得到多个文本信息;针对多个文本信息中的每个文本信息,确定文本信息与先行词集合中的每个先行词的共指概率;根据共指概率,分别确定每个文本信息指代的目标先行词;将目标先行词替代待改写文本中的文本信息,得到目标文本。由于本申请通过确定文本信息与先行词的共指概率,确定文本信息指代的目标先行词,能够准确地确定文本信息所指代的先行词,从而提高了对待改写文本进行改写的准确率。改写的准确率。改写的准确率。

【技术实现步骤摘要】
一种多轮问答改写方法、装置、电子设备及存储介质


[0001]本申请涉及智能问答与多轮对话改写
,特别涉及一种多轮问答改写方法、装置、电子设备及存储介质。

技术介绍

[0002]伴随着深度学习和大数据技术的发展,人机对话系统已经是人工智能领域的一项重要研究工作,并已经在智能客服、聊天机器人、智能助手等方面得到了广泛应用。根据人机交互的轮数,对话系统分为:单轮开放域对话系统和多轮开放域对话系统。
[0003]在多轮对话系统中,为了交流的简洁、流畅和高效性,通常会根据上下文做一些省略或者指代的说法。人们常常有一些口语化的表达,造成对话中会出现信息缺失和指代有歧义的情况,从而影响机器对语言的理解,最终导致多轮对话的效果欠佳。因此,需要机器识别语言文本中的代词,并对代词进行消解指代,提高对语言的理解。现有的消解指代方法多基于指针网络或文本生成方法,难以兼顾效率和语义完整性,同时在长文本环境和出现多指代情况时表现欠佳,对文本改写的准确率较低。

技术实现思路

[0004]本申请提供一种多轮问答改写方法、电子设备及存储介质,用以提本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多轮问答改写方法,其特征在于,包括:获取多轮对话中的上文数据和待改写文本;所述待改写文本为所述多轮对话中最新的问题;所述上文数据为所述多轮对话中除所述待改写文本之外的对话内容;根据配置的槽位信息,从所述上文数据中得到先行词集合;根据预设的区间长度集合,对所述待改写文本进行划分处理,得到多个文本信息;所述文本信息为包含所述区间长度的待改写文本;针对所述多个文本信息中的每个文本信息,确定所述文本信息与所述先行词集合中的每个先行词的共指概率;所述共指概率用于表征所述文本信息指代所述先行词的概率;根据所述共指概率,分别确定所述每个文本信息指代的目标先行词;将所述目标先行词替代所述待改写文本中的文本信息,得到目标文本。2.根据权利要求1所述的方法,其特征在于,针对所述多个文本信息中的每个文本信息,确定所述文本信息与所述先行词集合中的每个先行词的共指概率,包括:确定所述多个文本信息中的每个文本信息的实体得分;所述实体得分用于表征所述文本信息为实体词的概率;将所述实体得分大于设定阈值的文本信息作为候选文本信息;针对所述多个候选实体词中的每个候选文本信息,确定所述候选文本信息与所述先行词集合中的每个先行词的共指概率。3.根据权利要求2所述的方法,其特征在于,在确定所述多个文本信息中的每个文本信息的实体得分之前,所述方法还包括:针对所述多个文本信息中的每个文本信息和所述先行词集合中的每个先行词,确定所述每个文本信息对应的第一特征向量,以及所述每个先行词对应的第二特征向量;所述第一特征向量包括第一语义特征向量和除所述第一语义特征向量之外的第一其他特征信息;所述第二特征向量包括第二语义特征向量和除所述第二语义特征向量之外的第二其他特征信息;将所述第一特征向量和所述第二特征向量输入到全连接神经网络。4.根据权利要求3所述的方法,其特征在于,所述针对所述多个候选实体词中的每个候选文本信息,确定所述候选文本信息与所述先行词集合中的每个先行词的共指概率,包括:针对所述先行词集合中的每个先行词,基于所述全连接神经网络,根据所述第一特征向量,所述第二特征向量,所述第一特征向量与所述第二特征向量的乘积,所述第一特征向量与所述第二特征向量的差值,以及所述第一其他特征信息和所述第二其他特征信息,确...

【专利技术属性】
技术研发人员:汪铎李浩赵峂王中伟陈维强孙永良李建伟
申请(专利权)人:青岛海信网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1