英文FAQ问答系统实现方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34180100 阅读:26 留言:0更新日期:2022-07-17 12:52
本发明专利技术实施例公开了英文FAQ问答系统实现方法、装置、计算机设备及存储介质。方法包括:获取语音对话内容;对语音对话内容进行ASR转换,以得到语义文本;对语义文本进行处理,以得到待应答问句;召回相似问句;计算待应答问句与相似问句的单词交集在待应答问句内的占比,以得到第一占比值;判断第一占比值是否大于设定第一阈值;若大于,则计算待应答问句与相似问句的单词交集在相似问句内的占比,以得到第二占比值;判断第二占比值是否大于设定第二阈值;若大于,则将相似问句存储于结果集内;确定目标相似问句;确定问答对,并反馈问答对中的答案。通过实施本发明专利技术实施例的方法可实现做到英文FAQ的问答,满足海外市场的需求,实用性高。高。高。

Implementation method, device, computer equipment and storage medium of English FAQ question answering system

【技术实现步骤摘要】
英文FAQ问答系统实现方法、装置、计算机设备及存储介质


[0001]本专利技术涉及问答系统实现方法,更具体地说是指英文FAQ问答系统实现方法、装置、计算机设备及存储介质。

技术介绍

[0002]FAQ(常见问题解答,Frequently Asked Questions)的缩写,FAQ是当前网络上提供在线帮助的主要手段,通过事先组织好一些可能的常问问答对,发布在网页上或聊天群中为用户提供咨询服务。
[0003]当前,在全球疫情加重的情况下,海外市场对智能服务机器人的需求逐渐增加,而智能服务机器人的一个基本技能即FAQ问答系统尤为重要,但是现有的机器人大多采用中文问答的方式,无法做到英文FAQ的问答,并不能满足海外市场的需求,实用性不高。
[0004]因此,有必要设计一种新的方法,实现可做到英文FAQ的问答,满足海外市场的需求,实用性高。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺陷,提供英文FAQ问答系统实现方法、装置、计算机设备及存储介质。
[0006]为实现上述目的,本专利技术采用以下技术方案:英文FAQ问答系统实现方法,包括:
[0007]获取语音对话内容;
[0008]对所述语音对话内容进行ASR转换,以得到语义文本;
[0009]对所述语义文本进行处理,以得到待应答问句;
[0010]根据所述待应答问句从预设的问答库内召回相似问句;
[0011]计算所述待应答问句与所述相似问句的单词交集在所述待应答问句内的占比,以得到第一占比值;
[0012]判断所述第一占比值是否大于设定第一阈值;
[0013]若所述第一占比值大于设定第一阈值,则计算所述待应答问句与所述相似问句的单词交集在所述相似问句内的占比,以得到第二占比值;
[0014]判断所述第二占比值是否大于设定第二阈值;
[0015]若所述第二占比值大于设定第二阈值,则将所述相似问句存储于结果集内;
[0016]根据所述结果集内的相似问句的第一占比值以及第二占比值确定目标相似问句;
[0017]确定所述目标相似问句的问答对,并反馈所述问答对中的答案。
[0018]其进一步技术方案为:所述对所述语义文本进行处理,以得到待应答问句,包括:
[0019]对所述语义文本去除标点符号,以得到第一处理结果;
[0020]对所述第一处理结果进行切词以及标注词性,并将切词失败的词语进行组合,以得到第二处理结果;
[0021]对所述第二处理结果进行切词中缩写词的替换,以得到第三处理结果;
[0022]对所述第三处理结果统一单复数形式,以得到待应答问句。
[0023]其进一步技术方案为:所述根据所述待应答问句从预设的问答库内召回相似问句,包括:
[0024]计算所述待应答问句与预设的问答库内所有问句的相似匹配分数;
[0025]对所述相似匹配分数进行降序排序,以得到排序结果;
[0026]从所述排序结果内筛选出符合要求的问句,以得到相似问句。
[0027]其进一步技术方案为:所述计算所述待应答问句与所述相似问句的单词交集在所述待应答问句内的占比,以得到第一占比值,包括:
[0028]确定所述待应答问句与所述相似问句的单词交集,并确定所述单词交集的权重得分;
[0029]计算所述权重得分与所述待应答问句的长度的商,以得到第一占比值。
[0030]其进一步技术方案为:所述确定所述待应答问句与所述相似问句的单词交集,并确定所述单词交集的权重得分,包括:
[0031]对所述待应答问句进行切词并标注词性,并将词性为“NNS”和“NNPS”的单词转换成单数;
[0032]遍历所述相似句,对每句所述相似句标注词性;
[0033]遍历所述待应答问句中的每个单词,当单词出现在所述相似句中时,判断所述单词的词性是否存在词性权重表中;
[0034]若所述单词的词性存在词性权重表中,则确定所述单词为单词交集内的元素,将所述单词的词性对应的权重计入权重得分内;
[0035]确定所述权重得分为所述单词交集的权重得分;
[0036]若所述单词的词性存在词性权重表中,则将默认值计入权重得分内,并执行所述确定所述权重得分为所述单词交集的权重得分。
[0037]其进一步技术方案为:所述计算所述待应答问句与所述相似问句的单词交集在所述相似问句内的占比,以得到第二占比值,包括:
[0038]计算所述权重得分与所述相似问句的总权重的商,以得到第一占比值。
[0039]其进一步技术方案为:所述根据所述结果集内的相似问句的第一占比值以及第二占比值确定目标相似问句,包括:
[0040]对所述结果集内的相似问句按照第一占比值进行降序排序,对于具有相同的第一占比值的相似问句按照第二占比值进行降序排序,以得到排序后的结果集;
[0041]筛选排序后的结果集内的第一个相似问句,以得到目标相似问句。
[0042]本专利技术还提供了英文FAQ问答系统实现装置,包括:
[0043]内容获取单元,用于获取语音对话内容;
[0044]转换单元,用于对所述语音对话内容进行ASR转换,以得到语义文本;
[0045]预处理单元,用于对所述语义文本进行处理,以得到待应答问句;
[0046]相似问句召回单元,用于根据所述待应答问句从预设的问答库内召回相似问句;
[0047]第一计算单元,用于计算所述待应答问句与所述相似问句的单词交集在所述待应答问句内的占比,以得到第一占比值;
[0048]第一判断单元,用于判断所述第一占比值是否大于设定第一阈值;
[0049]第二计算单元,用于若所述第一占比值大于设定第一阈值,则计算所述待应答问句与所述相似问句的单词交集在所述相似问句内的占比,以得到第二占比值;
[0050]第二判断单元,用于判断所述第二占比值是否大于设定第二阈值;
[0051]存储单元,用于若所述第二占比值大于设定第二阈值,则将所述相似问句存储于结果集内;
[0052]目标问句确定单元,用于根据所述结果集内的相似问句的第一占比值以及第二占比值确定目标相似问句;
[0053]答案确定单元,用于确定所述目标相似问句的问答对,并反馈所述问答对中的答案。
[0054]本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
[0055]本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0056]本专利技术与现有技术相比的有益效果是:本专利技术通过获取语音对话内容后,对其进行ASR转换和预处理,形成待应答问句,根据待应答问句从预设的问答库内预先召回一部分粗粒度问句,形成相似问句,再采用相似度双阈值匹配,进行精确匹配相似问句,并从预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.英文FAQ问答系统实现方法,其特征在于,包括:获取语音对话内容;对所述语音对话内容进行ASR转换,以得到语义文本;对所述语义文本进行处理,以得到待应答问句;根据所述待应答问句从预设的问答库内召回相似问句;计算所述待应答问句与所述相似问句的单词交集在所述待应答问句内的占比,以得到第一占比值;判断所述第一占比值是否大于设定第一阈值;若所述第一占比值大于设定第一阈值,则计算所述待应答问句与所述相似问句的单词交集在所述相似问句内的占比,以得到第二占比值;判断所述第二占比值是否大于设定第二阈值;若所述第二占比值大于设定第二阈值,则将所述相似问句存储于结果集内;根据所述结果集内的相似问句的第一占比值以及第二占比值确定目标相似问句;确定所述目标相似问句的问答对,并反馈所述问答对中的答案。2.根据权利要求1所述的英文FAQ问答系统实现方法,其特征在于,所述对所述语义文本进行处理,以得到待应答问句,包括:对所述语义文本去除标点符号,以得到第一处理结果;对所述第一处理结果进行切词以及标注词性,并将切词失败的词语进行组合,以得到第二处理结果;对所述第二处理结果进行切词中缩写词的替换,以得到第三处理结果;对所述第三处理结果统一单复数形式,以得到待应答问句。3.根据权利要求1所述的英文FAQ问答系统实现方法,其特征在于,所述根据所述待应答问句从预设的问答库内召回相似问句,包括:计算所述待应答问句与预设的问答库内所有问句的相似匹配分数;对所述相似匹配分数进行降序排序,以得到排序结果;从所述排序结果内筛选出符合要求的问句,以得到相似问句。4.根据权利要求1所述的英文FAQ问答系统实现方法,其特征在于,所述计算所述待应答问句与所述相似问句的单词交集在所述待应答问句内的占比,以得到第一占比值,包括:确定所述待应答问句与所述相似问句的单词交集,并确定所述单词交集的权重得分;计算所述权重得分与所述待应答问句的长度的商,以得到第一占比值。5.根据权利要求4所述的英文FAQ问答系统实现方法,其特征在于,所述确定所述待应答问句与所述相似问句的单词交集,并确定所述单词交集的权重得分,包括:对所述待应答问句进行切词并标注词性,并将词性为“NNS”和“NNPS”的单词转换成单数;遍历所述相似句,对每句所述相似句标注词性;遍历所述待应答问句中的每个单词,当单词出现在所述相似句中时,判断所述单词的词性是否存在词性权重表中;若所述单词...

【专利技术属性】
技术研发人员:金磊赵康王一科贾林涂静一
申请(专利权)人:深圳卫安智能机器人科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1