结合RPA及AI的对话问答方法、装置、设备及存储介质制造方法及图纸

技术编号:26418588 阅读:19 留言:0更新日期:2020-11-20 14:13
本申请实施例提供了一种结合RPA及AI的对话问答方法、装置、设备及存储介质。该方法包括:用户输入的目标问题;确定目标问题对应的至少一个候选问题;提取目标问题中的目标概念并提取各候选问题中候选概念;对目标概念进行清洗处理;根据清洗后的目标概念和各候选问题中候选概念计算目标问题与各候选问题间的语义相关度;根据目标问题与各候选问题间的语义相关度确定标准问题;根据标准问题确定目标问题对应的目标答案;输出目标答案。由于对目标概念进行了清洗处理,可有效解决提取的目标概念边界不清晰或短语粒度过细等问题。并且能够使确定出的目标答案更加准确,提高了向用户推荐的答案准确性,大大提高了用户对问答系统的使用体验。

【技术实现步骤摘要】
结合RPA及AI的对话问答方法、装置、设备及存储介质
本申请实施例涉及自然语音处理
,尤其涉及一种结合RPA(RoboticProcessAutomation,机器人流程自动化)及AI(ArtificialIntelligence,人工智能)的对话问答方法、装置、设备及存储介质。
技术介绍
机器人流程自动化(RoboticProcessAutomation,简称:RPA)是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。人工智能(ArtificialIntelligence,简称:AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。随着人工智能技术的成熟,自然语言处理技术也得到了快速发展。自然语音处理技术是人工智能领域中的一个重要方向。它能够实现人与计算机之间用自然语言进行有效通信。对话问答系统是一个以自然语言理解技术为核心,完成对用户问题的分析处理,并生成正确答案的系统。在对话问答系统进行用户问题的分析时,需要提取用户问题中的概念,现有技术中,提取用户问题中的概念时,存在提取后的概念边界不清晰或短语粒度过细等问题。导致不能准确地对用户问题中的概念进行提取,进而使对用户问题解析不准确,向用户推荐的答案准确性较差,降低了用户对问题系统的使用体验。
技术实现思路
本申请实施例提供一种结合RPA及AI的对话问答方法、装置、设备及存储介质,解决了现有技术中抽取用户问题中的概念时,存在抽取后的概念边界不清晰或短语粒度过细等问题。导致不能准确地对用户问题中的概念进行抽取,进而使对用户问题解析不准确,向用户推荐的答案准确性较差,降低了用户对问题系统的使用体验的技术问题。第一方面,本申请实施例提供一种结合RPA及AI的对话问答方法,所述方法应用于电子设备,所述方法包括:接收用户输入的目标问题;确定所述目标问题对应的至少一个候选问题;提取所述目标问题中的目标概念并提取各所述候选问题中候选概念;对所述目标概念进行清洗处理;根据所述清洗后的目标概念和各所述候选问题中候选概念计算所述目标问题与各所述候选问题间的语义相关度;根据所述目标问题与各所述候选问题间的语义相关度确定标准问题;根据所述标准问题确定所述目标问题对应的目标答案;输出所述目标答案。进一步地,如上所述的方法,所述提取所述目标问题中的目标概念,包括:将所述目标问题与预设的目标领域问句模板集中的各问句模板进行正则匹配;获取与所述目标问题相匹配的问句模板;确定所述目标问题与所述相匹配的问句模板之间的增加文本;将所述增加文本确定为目标概念。进一步地,如上所述的方法,若所述目标领域问句模板集中不存在与所述目标问题相匹配的问句模板,则还包括:将所述目标问题与预先构建的目标领域概念集中的各待选概念进行关键词匹配;获取与所述目标问题匹配度最高的待选概念;将所述相匹配度最高的待选概念确定为所述目标问题的目标概念。进一步地,如上所述的方法,所述对所述目标概念进行清洗处理,包括:对所述目标概念进行切词处理,以获得所述目标概念对应的各待选单词;判断各所述待选单词是否满足过滤条件,若待选单词满足过滤条件,则对该待选单词进行过滤;依次判断各连续两个待选单词是否满足合并条件,若连续两个待选单词满足合并条件,则对该连续两个待选单词进行合并。进一步地,如上所述的方法,所述判断各所述待选单词是否满足过滤条件,包括:判断各待选单词是否是停用词或预设常用词;若所述待选单词是停用词或预设常用词,则确定该待选单词满足过滤条件;若所述待选单词不是停用词或预设常用词,则确定该待选单词不满足过滤条件。进一步地,如上所述的方法,所述判断各待选单词是否是预设常用词,包括:确定各待选单词在目标领域常用词集或通用领域常用词集中的IDF取值;若待选单词在所述目标领域常用词集中的IDF取值小于第一预设IDF阈值,则确定该待选单词为预设常用词;或者,若待选单词在所述通用领域常用词集中的IDF取值小于第二预设IDF阈值,则确定该待选单词为预设常用词;其中,所述第二预设IDF阈值小于所述第一预设IDF阈值。进一步地,如上所述的方法,还包括:若所述待选单词在目标领域常用词集中的IDF取值与所述第一预设IDF阈值的差值小于第三预设IDF阈值,且该待选单词在通用领域常用词集中的IDF取值与第二预设IDF阈值的差值小于第三预设IDF阈值,则确定该待选单词为预设常用词;其中,所述差值为正数。进一步地,如上所述的方法,所述依次判断各连续两个待选单词是否满足合并条件,包括:依次判断各连续两个待选单词是否是确定后的概念或预先构建的双词集中的频繁项;若连续两个待选单词是确定后的概念或所述双词集中的频繁项,则确定连续两个待选单词满足合并条件;若连续两个待选单词不是确定后的概念且不是所述双词集中的频繁项,则根据该连续两个待选单词中的各待选单词确定该连续两个待选单词是否满足合并条件。进一步地,如上所述的方法,所述根据该连续两个待选单词中的各待选单词来确定该连续两个待选单词是否满足合并条件,包括:根据该连续两个待选单词中的各待选单词是否均为预先构建的单词集中的频繁项确定该连续两个待选单词是否满足合并条件。进一步地,如上所述的方法,所述根据该连续两个待选单词中的各待选单词是否均为预先构建的单词集中的频繁项确定该连续两个待选单词是否满足合并条件,包括:判断该连续两个待选单词中的各待选单词是否均为预先构建的单词集中的频繁项;若该连续两个待选单词中的各待选单词均不是所述单词集中的频繁项,则确定该连续两个待选单词满足合并条件;若该连续两个待选单词至少有一个是所述单词集中的频繁项,则确定该连续两个待选单词不满足合并条件。进一步地,如上所述的方法,所述依次判断各连续两个待选单词是否是预先构建的双词集中的频繁项,包括:依次判断各连续两个待选单词在所述双词集中的频次数值是否大于第一预设频次阈值;若连续两个待选单词在所述双词集中的频次数值大于第一预设频次阈值,则确定该连续两个待选单词是所述双词集中的频繁项;若连续两个待选单词在所述双词集中的频次数值小于或等于第一预设频次阈值,则确定该连续两个待选单词不是所述双词集中的频繁项。进一步地,如上所述的方法,所述判断连续两个待选单词中的各待选单词是否均为预先构建的单词集中的频繁项,包括:判断连续两个待选单词中的各待选单词在所述单词集中的频次数值是否均大于第二预设频次阈值;若均大于所述第二预设频次阈值,则确定该连续两个待选单词中的各待选单词均是所述单词集中的频繁项;若至少有一个小于或等于所述第二预设频次阈值,则确定该连续两个待选单词中的各待选单词不均是所述单词集中的频繁项。进一步地,如上所述的方法,所述若连续两个待选单词满足合并条件,则对该连续两个待选单词进行合并之后,还包括:判断目标概念中是否包括多余词汇;若包括所述多余词汇,则对所述多余词汇进行清除。进一步地,如本文档来自技高网...

【技术保护点】
1.一种结合RPA及AI的对话问答方法,其特征在于,所述方法应用于电子设备,所述方法包括:/n接收用户输入的目标问题;/n确定所述目标问题对应的至少一个候选问题;/n提取所述目标问题中的目标概念并提取各所述候选问题中候选概念;/n对所述目标概念进行清洗处理;/n根据所述清洗后的目标概念和各所述候选问题中候选概念计算所述目标问题与各所述候选问题间的语义相关度;/n根据所述目标问题与各所述候选问题间的语义相关度确定标准问题;/n根据所述标准问题确定所述目标问题对应的目标答案;/n输出所述目标答案。/n

【技术特征摘要】
20191231 CN 20191141353461.一种结合RPA及AI的对话问答方法,其特征在于,所述方法应用于电子设备,所述方法包括:
接收用户输入的目标问题;
确定所述目标问题对应的至少一个候选问题;
提取所述目标问题中的目标概念并提取各所述候选问题中候选概念;
对所述目标概念进行清洗处理;
根据所述清洗后的目标概念和各所述候选问题中候选概念计算所述目标问题与各所述候选问题间的语义相关度;
根据所述目标问题与各所述候选问题间的语义相关度确定标准问题;
根据所述标准问题确定所述目标问题对应的目标答案;
输出所述目标答案。


2.根据权利要求1所述的方法,其特征在于,所述对所述目标概念进行清洗处理,包括:
对所述目标概念进行切词处理,以获得所述目标概念对应的各待选单词;
判断各所述待选单词是否满足过滤条件,若待选单词满足过滤条件,则对该待选单词进行过滤;
依次判断各连续两个待选单词是否满足合并条件,若连续两个待选单词满足合并条件,则对该连续两个待选单词进行合并。


3.根据权利要求2所述的方法,其特征在于,所述判断各所述待选单词是否满足过滤条件,包括:
判断各待选单词是否是停用词或预设常用词;
若所述待选单词是停用词或预设常用词,则确定该待选单词满足过滤条件;
若所述待选单词不是停用词或预设常用词,则确定该待选单词不满足过滤条件。


4.根据权利要求2所述的方法,其特征在于,所述依次判断各连续两个待选单词是否满足合并条件,包括:
依次判断各连续两个待选单词是否是确定后的概念或预先构建的双词集中的频繁项;
若连续两个待选单词是确定后的概念或所述双词集中的频繁项,则确定连续两个待选单词满足合并条件;
若连续两个待选单词不是确定后的概念且不是所述双词集中的频繁项,则根据该连续两个待选单词中的各待选单词确定该连续两个待选单词是否满足合并条件。


5.根据权利要求4所述的方法,其特征在于,所述根据该连续两个待选单词中的各待选单词来确定该连续两个待选单词是否满足合并条件,包括:
根据该连续两个待选单词中的各待选单词是否均为预先构建的单词集中的频繁项确定该连续两个待选单词是否满足合并条件。


6.根据权利要求2所述的方法,其特征在于,所述若连续两个待选单词满足合并条件,则对该连续两个待选单词进行合并之后,还包括:
判断目标概念中是否包括多余词汇;
若包括所述多余词汇,则对所述多余词汇进行清除。


7.根据权利要求1所述的方法,其特征在于,所述提取各所述候选问题中候选概念之后,还包括:
对所述候选概念进行清洗处理。


8.根据权利要求7所述的方法,其特征在于,所述根据所述清洗后的目标概念和各所述候选问题中候选概念计算所述目标问题与各所述候选问题间的语义相关度,包括:
确定所述清洗后的目标概念及各所述候选问题中清洗后的候选概念对应的语义特征数据;
将所述清洗后的目标概念对应的语义特征数据与各所述候选问题中清洗后的候选概念对应的语义特征数据输入到预设WMD算法模型中...

【专利技术属性】
技术研发人员:张晓庆张海雷胡一川汪冠春
申请(专利权)人:北京来也网络科技有限公司北京奔影网络科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1