一种问题生成方法、装置、设备及存储介质制造方法及图纸

技术编号:32460288 阅读:27 留言:0更新日期:2022-02-26 08:47
本公开涉及计算机技术领域,公开了一种问题生成方法、装置、设备及存储介质。该方法包括:获取包括第一会话和至少一个第二会话的会话集合,第一会话为待检测问题对应的答案,至少一个第二会话是基于第一会话确定的,并对会话集合进行编码处理,获得对应的文本特征向量矩阵;通过对文本特征向量矩阵进行特征提取,分别获得表征上下文关联度的第一特征向量矩阵,以及表征特征向量相似度的第二特征向量矩阵,再基于获得的两个特征向量矩阵,从会话集合中筛选出目标会话,该目标会话为待检测问题。结合会话场景的特点,以会话集合的时间序列和会话内容间的相似性为基础,提取出更丰富的特征向量,从而在相同解码条件下,获得更好的问题生成结果。的问题生成结果。的问题生成结果。

【技术实现步骤摘要】
一种问题生成方法、装置、设备及存储介质


[0001]本公开涉及计算机
,提供了一种问题生成方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能(Artificial Intelligence,AI)技术和自然语言处理(Natural Language Processing,NLP)技术的发展,为了满足人们对快速、准确地获取信息的需求,依托于上述两项技术的问答系统、智能客服系统等语义检索系统应运而生,并逐渐应用于人们的日常生活中。
[0003]为了让语义检索系统从“用户主导对话”的被动服务,转变为“系统引导对话”的主动服务,以及提高语义检索系统提出的问题命中用户想要咨询内容的概率,通常是使用问题生成模型搭建语义检索系统的知识库,该知识库包含多个问题

答案组成的文本关系对(简称为问答对)。
[0004]早期的问题生成模型由编码器和解码器组成,先使用编码器对会话集合进行编码处理,获得相应的文本特征向量矩阵,再使用解码器对文本特征向量矩阵进行解码处理,获得表征问题的会话。然而,在解码过程中,解码器每本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种问题生成方法,其特征在于,包括:获取会话集合,所述会话集合包括第一会话和至少一个第二会话,所述第一会话为待检测问题对应的答案,所述至少一个第二会话是基于所述第一会话确定的;对所述会话集合进行编码处理,获得对应的文本特征向量矩阵;通过对所述文本特征向量矩阵进行特征提取,分别获得第一特征向量矩阵以及第二特征向量矩阵,其中,所述第一特征向量矩阵表征各个文本特征向量之间的上下文关联度,所述第二特征向量矩阵表征所述至少一个第二会话的文本特征向量与所述第一会话的文本特征向量之间的特征向量相似度;基于所述第一特征向量矩阵和所述第二特征向量矩阵,从所述会话集合中筛选出目标会话,所述目标会话为所述待检测问题。2.如权利要求1所述的方法,其特征在于,还包括:删除第一会话群组中设定会话对象的第三会话,以及符合预设会话删除条件的第三会话,获得相应的第二会话群组;其中,所述第一会话群组是通过划分多个第三会话,获得的其中一个会话群组;将所述第二会话群组中句子长度超过预设的第一句子长度阈值的第三会话,作为所述第一会话。3.如权利要求2所述的方法,其特征在于,所述设定会话删除条件包括以下至少一种:一个第三会话中包含设定的停用词;所述一个第三会话的句子长度超过预设的第二句子长度阈值。4.如权利要求1所述的方法,其特征在于,所述对所述会话集合进行编码处理,获得对应的文本特征向量矩阵,包括:对所述会话集合中的所述第一会话以及所述至少一个第二会话进行向量化处理,获得各自对应的会话特征向量;通过编码器对各个会话特征向量进行编码处理,获得各自对应的文本特征向量,并通过拼接各个文本特征向量,获得所述文本特征向量矩阵。5.如权利要求4所述的方法,其特征在于,所述对所述会话集合中的所述第一会话以及所述至少一个第二会话进行向量化处理,获得各自对应的会话特征向量,包括:对所述会话集合中的所述第一会话以及所述至少一个第二会话进行向量化处理,分别获得所述第一会话的会话对象特征向量、会话内容特征向...

【专利技术属性】
技术研发人员:徐梓钧冯旻伟尹竞成阮良马春平
申请(专利权)人:杭州网易智企科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1