问答匹配方法及模型训练方法、装置、设备、存储介质制造方法及图纸

技术编号:23890782 阅读:40 留言:0更新日期:2020-04-22 06:22
本申请实施例提供一种问答匹配方法及模型训练方法、装置、设备、存储介质,其中,方法包括:获取问答匹配文档对应的第一词序列,所述问答匹配文档包括待解答的问题和用于匹配所述问题答案的文本,所述第一词序列中包括至少两个词,每一词包括一个或多个字;在所述第一词序列中,确定用于设置字符的目标位置;在所述目标位置设置用于表征答案类型的字符,形成第二词序列;在所述第二词序列中,确定与所述问题对应的答案的开始位置和结束位置;根据所述开始位置和所述结束位置在所述第二词序列中对应的内容,确定对应问题匹配的答案。通过本申请,能够支持多答案类型的机器阅读理解任务,从而满足用户对多答案类型的需求,提高用户体验。

【技术实现步骤摘要】
问答匹配方法及模型训练方法、装置、设备、存储介质
本申请实施例涉及人工智能
,涉及但不限于一种问答匹配方法及模型训练方法、装置、设备、存储介质。
技术介绍
随着人工智能技术的发展,机器阅读理解技术也得到了大量的应用,例如,在网页搜索、问答机器人和智能语音助手等多个应用场景下,都会使用到机器阅读理解技术。通常情况下,机器阅读理解时的答案输出包括多种类型,例如,片段型、是否型和无答案类型。目前的机器阅读理解技术通常为抽取式机器阅读理解技术,即在用于匹配问题答案的文本中抽取一部分内容作为问题的答案。目前的机器阅读理解技术仅能支持文本片段型这一种答案类型作为输出,无法应对真实场景下用户对多答案类型的需求,用户体验较差。
技术实现思路
本申请实施例提供一种问答匹配方法及模型训练方法、装置、设备、存储介质,能够支持多答案类型的机器阅读理解任务,从而满足用户对多答案类型的需求,提高用户体验。本申请实施例的技术方案是这样实现的:本申请实施例提供一种问答匹配方法,包括:获取问答匹配文档对应的第一词序列,所述问答匹配文档包本文档来自技高网...

【技术保护点】
1.一种问答匹配方法,其特征在于,包括:/n获取问答匹配文档对应的第一词序列,所述问答匹配文档包括待解答的问题和用于匹配所述问题答案的文本,所述第一词序列中包括至少两个词,每一词包括一个或多个字;/n在所述第一词序列中,确定用于设置字符的目标位置;/n在所述目标位置设置用于表征答案类型的字符,形成第二词序列;/n在所述第二词序列中,确定与所述问题对应的答案的开始位置和结束位置;/n根据所述开始位置和所述结束位置在所述第二词序列中对应的内容,确定对应问题匹配的答案。/n

【技术特征摘要】
1.一种问答匹配方法,其特征在于,包括:
获取问答匹配文档对应的第一词序列,所述问答匹配文档包括待解答的问题和用于匹配所述问题答案的文本,所述第一词序列中包括至少两个词,每一词包括一个或多个字;
在所述第一词序列中,确定用于设置字符的目标位置;
在所述目标位置设置用于表征答案类型的字符,形成第二词序列;
在所述第二词序列中,确定与所述问题对应的答案的开始位置和结束位置;
根据所述开始位置和所述结束位置在所述第二词序列中对应的内容,确定对应问题匹配的答案。


2.根据权利要求1所述的方法,其特征在于,所述获取问答匹配文档对应的第一词序列,包括:
对所述问题和所述文本依次进行分词处理,得到包括至少一个问题词和至少一个文本词的所述第一词序列,其中所述文本词位于所述问题词之后。


3.根据权利要求2所述的方法,其特征在于,所述在所述第一词序列中,确定用于设置字符的目标位置,包括:
在所述第一词序列中,将位于所述问题词之前的位置,确定为所述目标位置;或者,
在所述第一词序列中,将位于所述问题词与所述文本词之间的位置,确定为所述目标位置;或者,
在所述第一词序列中,将位于所述文本词之后的位置,确定为所述目标位置。


4.根据权利要求1所述的方法,其特征在于,所述在所述第二词序列中,确定与所述问题对应的答案的开始位置和结束位置,包括:
对所述第二词序列中的词和字符分别进行特征提取,对应得到词特征向量和字符特征向量;
根据所述词特征向量和所述字符特征向量,确定所述第二词序列中的词和字符分别作为答案的开始位置和结束位置的概率值;
根据所述概率值,确定所述答案的开始位置和结束位置。


5.根据权利要求4所述的方法,其特征在于,所述根据所述词特征向量和所述字符特征向量,确定所述第二词序列中的词和字符分别作为答案的开始位置和结束位置的概率值,包括:
分别对所述词特征向量和字符特征向量依次进行线性变换和归一化处理,得到所述第二词序列中的词和字符分别作为所述开始位置和所述结束位置对应的概率值集合;
所述概率值集合中包括至少两个所述概率值,所述概率值是用于表征所述答案的开始位置或结束位置的分布概率。


6.根据权利要求5所述的方法,其特征在于,所述分别对所述词特征向量和字符特征向量依次进行线性变换和归一化处理,得到所述第二词序列中的词和字符分别作为所述开始位置和所述结束位置对应的概率值集合,包括:
分别对所述词特征向量和字符特征向量,依次进行第一线性变换和第一归一化处理,得到与所述第二词序列中的词和字符对应的第一概率值集合;
所述第一概率值集合中包括至少两个第一概率值,所述第一概率值是用于表征所述答案的开始位置的分布概率;
分别对所述词特征向量和字符特征向量,依次进行第二线性变换和第二归一化处理,得到与所述第二词序列中的词和字符对应的第二概率值集合;
所述第二概率值集合中包括至少两个第二概率值,所述第二概率值是用于表征所述答案的结束位置的分布概率。


7.根据权利要求6所述的方法,其特征在于,所述根据所述概率值,确定所述答案的开始位置和结束位置,包括:
将所述第一概率值集合中最大第一概率值对应的词或字符,确定为目标开始内容;将所述目标开始内容在所述第二词序列中所处的位置,确定为所述开始位置;
将所述第二概率值集合中最大第二概率值对应的词或字符,确定为目标结束内容;将所述...

【专利技术属性】
技术研发人员:闫昭张士卫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1