一种问题生成方法、装置、设备及存储介质制造方法及图纸

技术编号:24888836 阅读:26 留言:0更新日期:2020-07-14 18:16
本申请提供了一种问题生成方法、装置、设备及存储介质;所述方法包括,通过第一编码模型对参考文本对应的第一词向量、答案信息向量、和当前问答轮数对应的文本位置向量进行编码处理,得到第一语义向量序列;通过第二编码模型对历史问答文本对应的第二词向量进行编码处理,得到第二语义向量序列;通过解码模型对所述第一语义向量序列和所述第二语义向量序列进行解码处理,得到所述当前轮数对应的问题文本;输出所述问题文本。通过本申请,能够结合历史对话内容生成连贯且对话性良好的问题。

【技术实现步骤摘要】
一种问题生成方法、装置、设备及存储介质
本申请涉及通信
,尤其涉及一种问题生成方法、装置及存储介质。
技术介绍
随着人工智能技术的飞速发展,作为人工智能的最为重要的研究领域之一的自然语言处理的研究内容也越来越丰富,例如包括机器翻译、自动文摘、问题生成等。问题生成(QuestionGeneration,QG)技术作为信息检索中的一种高级检索形式,是根据一段文字,自动生成相应问题的技术。问题生成技术可用于在教育场景中进行知识测试,如智能导师系统(IntelligenceTutorSystem),可以主动提出一些针对阅读理解的问题,测试学生对于文章的理解;同时,该技术也可以应用到聊天机器人,语音助手中,使得聊天系统能够主动提问题,以增强对话的交互性与持续性。另外,问题生成技术还可以应用在医药领域,例如可以用于自动问诊系统,通过与病人的对话进行诊断。现有的问题生成方法主要关注于阅读理解文本上单句话的问题生成,经常由于不能考虑之前的对话内容而使得对话不连贯,从而带来不好的用户体验。
技术实现思路
本申请实施例提供一种问题生成方法、装置、本文档来自技高网...

【技术保护点】
1.一种问题生成方法,其特征在于,所述方法包括:/n通过第一编码模型对参考文本对应的第一词向量、答案信息向量、和当前问答轮数对应的文本位置向量进行编码处理,得到第一语义向量序列;/n通过第二编码模型对历史问答文本对应的第二词向量进行编码处理,得到第二语义向量序列;/n通过解码模型对所述第一语义向量序列和所述第二语义向量序列进行解码处理,得到所述当前问答轮数对应的问题文本;/n输出所述问题文本;/n获取所述问题文本对应的答题文本;/n当所述答题文本和预设的答案文本满足匹配关系时,将所述当前问答轮数的取值更新为下一问答轮数的取值;/n当所述答题文本和所述答案文本不满足匹配关系时,保持所述当前问答轮...

【技术特征摘要】
1.一种问题生成方法,其特征在于,所述方法包括:
通过第一编码模型对参考文本对应的第一词向量、答案信息向量、和当前问答轮数对应的文本位置向量进行编码处理,得到第一语义向量序列;
通过第二编码模型对历史问答文本对应的第二词向量进行编码处理,得到第二语义向量序列;
通过解码模型对所述第一语义向量序列和所述第二语义向量序列进行解码处理,得到所述当前问答轮数对应的问题文本;
输出所述问题文本;
获取所述问题文本对应的答题文本;
当所述答题文本和预设的答案文本满足匹配关系时,将所述当前问答轮数的取值更新为下一问答轮数的取值;
当所述答题文本和所述答案文本不满足匹配关系时,保持所述当前问答轮数的取值。


2.根据权利要求1中所述的方法,其特征在于,所述方法还包括:
获取参考文本中各个分词对应的原始词向量和属性信息,其中,所述属性信息表征所述分词是否为答案;
当所述分词的属性信息表明所述分词不为答案时,将所述分词对应的原始词向量映射为第一词向量;
当所述分词的属性信息表明所述分词为答案时,将所述分词对应的原始词向量映射为答案信息向量。


3.根据权利要求1中所述的方法,其特征在于,所述通过第一编码模型对获取到的参考文本对应的第一词向量、答案信息向量、当前问答轮数对应的文本位置向量进行编码处理,得到第一语义向量序列,包括:
将所述第一词向量、答案信息向量和文本位置向量进行拼接得到拼接向量;
通过所述第一编码模型将所述拼接向量转换为具有固定长度的中间向量;
在所述中间向量中编码所述拼接向量的序列信息,得到第一语义向量序列。


4.根据权利要求1中所述的方法,其特征在于,所述通过解码模型对所述第一语义向量序列和所述第二语义向量序列进行解码处理,得到所述当前轮数对应的问题文本,包括:
通过解码模型对所述第一语义向量序列和第二语义向量序列,进行逐词解码;
在逐词解码过程中,将所述解码模型的篇章位置注意力分布集中在所述当前轮数对应的文本中,以及
当解码输出代词时,将所述解码模型的注意力分布集中到第二语义向量序列中的实体名词,以使得生成所述当前轮数对应的指代对齐的问题文本。


5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
获取初始的解码模型和训练文本对应的第三语义向量序列;
通过所述解码模型对所述第三语义向量序列进行解码、且确定需要生成代词时,根据第一优化目标函数,对所述解码模型的参数进行调整,以使所述解码模型的注意力分布集中到实体名词。


6.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
至少根据第一优化目标函数和第二优化目标函数对所述解码模型进行联合训练,以对所述解码模型的参数进行调整;
其中,所述第一优化目标函数用于在需要生成代词时,将所述解码模型的注意力分布集中到实体名词,第二优化目标函数用于优化每一轮问答对话对应的篇章位置注意力分布,以使得所述解码模型的篇章位置注意力分布集中到当前问答轮数对应的文本。


7.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
将所述参考文本划分为至少两个部分,并获取各个部分在所述参考文本中的位置信息;
基于问答轮数和各个部分之间的对应关系,确定当前问答轮数对应的部分,和所述部分对应的位置信息;
基于所述部分对应的位置信息确定所述当前问答轮数对应的文本位置信息;<...

【专利技术属性】
技术研发人员:高一帆李丕绩
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1