问答对生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:33709200 阅读:22 留言:0更新日期:2022-06-06 08:38
本公开公开了一种问答对生成方法、装置、电子设备和存储介质,尤其涉及自然语言处理、深度学习等人工智能技术领域。其中,具体方案为:将日志中的对话记录进行预处理,以获取对话记录中包含的会话及会话对应的第一核心词;确定会话中每个语句对应的类型标签,其中,类型标签为以下任意一项:问题类型、答案类型及其他类型;根据每个语句对应的类型标签,生成候选问答对;基于会话对应的第一核心词,对每个候选问答对进行改写,以生成目标问答对。由此,可以基于会话中每个语句对应的类型标签,生成候选问答对,再基于会话对应的第一核心词,对该候选问答对进行改写,以生成目标问答对,从而提高了目标问答对的数量和质量。从而提高了目标问答对的数量和质量。从而提高了目标问答对的数量和质量。

【技术实现步骤摘要】
问答对生成方法、装置、电子设备和存储介质


[0001]本公开涉及计算机
,具体涉及自然语言处理、深度学习等人工智能
,尤其涉及一种问答对生成方法、装置、电子设备和存储介质。

技术介绍

[0002]随着计算机技术的发展,智能问答系统使用的也越来越广泛。比如在客服系统中,对于常见的问题,通常可以通过提前设定的问答对资源进行解答。但由于问答资源量可能存在一定的限制,以至部分问题,可能无法通过问答对资源进行解答,需要人工解答。由此,如何生成有效的问答对,以对问答对资源进行扩充,显得至关重要。

技术实现思路

[0003]本公开提供了一种问答对生成方法、装置、电子设备和存储介质。
[0004]本公开一方面,提供了一种问答对生成方法,包括:
[0005]将日志中的对话记录进行预处理,以获取所述对话记录中包含的会话及所述会话对应的第一核心词;
[0006]确定所述会话中每个语句对应的类型标签,其中,所述类型标签为以下任意一项:问题类型、答案类型及其他类型;
[0007]根据每个所述语句对应的类型标签,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种问答对生成方法,其中,所述方法包括:将日志中的对话记录进行预处理,以获取所述对话记录中包含的会话及所述会话对应的第一核心词;确定所述会话中每个语句对应的类型标签,其中,所述类型标签为以下任意一项:问题类型、答案类型及其他类型;根据每个所述语句对应的类型标签,生成候选问答对;基于所述会话对应的第一核心词,对每个所述候选问答对进行改写,以生成目标问答对。2.如权利要求1所述的方法,其中,所述根据每个所述语句对应的类型标签,生成候选问答对,包括:依次遍历所述会话中的每个语句;在第一语句的类型标签为问题类型的情况下,确定所述第一语句为候选问答对中的候选问题语句;对所述第一语句后的语句继续进行遍历,在第二语句的类型标签为其他类型、且所述第二语句与所述第一语句间包含类型标签为答案类型的语句的情况下,将所述第二语句与所述第一语句间包含的答案类型的语句确定为所述候选问答对中的候选答案语句。3.如权利要求1所述的方法,其中,所述基于所述会话对应的第一核心词,对每个所述候选问答对进行改写,以生成目标问答对,包括:基于所述第一核心词,对所述候选问答对中的候选问题语句和/或候选答案语句进行改写,以生成所述目标问答对中的目标问题语句。4.如权利要求1所述的方法,其中,所述对每个所述候选问答对进行改写,以生成目标问答对,包括:对所述候选问答对中的候选答案语句进行语义识别,以确定所述候选答案语句对应的第二核心词;基于所述第二核心词及所述候选问答对中的候选问题语句,对所述候选答案语句进行改写,以生成所述目标问答对中的目标答案语句。5.如权利要求1所述的方法,其中,所述根据每个所述语句对应的类型标签,生成候选问答对,包括:对所述会话进行解析,以确定所述会话对应的场景;根据所述场景,对每个所述语句中的冗余词进行过滤处理;根据每个处理后的语句对应的类型标签,生成候选问答对。6.如权利要去1

5中任一所述的方法,其中,在所述对每个所述候选问答对进行改写,以生成目标问答对之后,还包括:确定每个所述目标问答对中的目标问题语句及目标答案语句间的问答对匹配度;在所述目标问题语句与对应的目标答案语句间的问答对匹配度大于阈值的情况下,将所述目标问答对添加至目标问答库中。7.一种问答对生成装置,其中,所述方法包括:获取模块,用于将日志中的对话记录进行预处理,以获取所述对话记录中包含的会话及所述会话对应的第一核心词;
确定模块,用于确定所述会话中每个语句对应的类型标签,其中,所述类型标签为以下...

【专利技术属性】
技术研发人员:刘坤刘凯
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1