答案生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34640751 阅读:6 留言:0更新日期:2022-08-24 15:16
本申请涉及一种答案生成方法、装置、电子设备及存储介质,涉及机器人流程自动化RPA及人工智能AI技术领域,方法包括:获取查询语句以及查询语句所属的问题类型;从至少一个文档包括的多个内容片段中,获取与查询语句匹配的目标内容片段;按照问题类型对应的应答策略,基于目标内容片段,生成查询语句对应的目标答案。由此,通过代替人工自动生成答案,减少了生成答案所需的人力成本及时间成本,且通过从文档中精确确定能够回答用户问题的目标内容片段,并根据该目标内容片段生成查询语句对应的答案,提高了生成的答案的准确性。本申请还能结合RPA和AI实现IA的获取文档中的内容片段,进一步减少了生成答案所需的人工成本。进一步减少了生成答案所需的人工成本。进一步减少了生成答案所需的人工成本。

【技术实现步骤摘要】
答案生成方法、装置、电子设备及存储介质


[0001]本申请涉及机器人流程自动化及人工智能
,特别涉及一种答案生成方法、装置、电子设备及存储介质。

技术介绍

[0002]机器人流程自动化(Robotic Process Automation,简称RPA),是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
[0003]人工智能(Artificial Intelligence,简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
[0004]智能自动化(Intelligent Automation,简称IA)是一系列从机器人流程自动化到人工智能的技术总称,将RPA与光学字符识别(Optical Character Recognition,OCR)、智能字符识别(Intelligent Character Recognition,ICR)、流程挖掘(Process Mining)、深度学习(Deep Learning,DL)、机器学习(Machine Learning,ML)、自然语言处理(Natural Language Processing,NLP)、语音识别(Automatic Speech Recognition,ASR)、语音合成(Text To Speech,TTS)、计算机视觉(Computer Vision,CV)等多种AI技术相结合,以创建能够思考、学习及自适应的端到端的业务流程,涵盖从流程发现、流程自动化,到通过自动而持续的数据收集、理解数据的含义,使用数据来管理和优化业务流程的整个历程。
[0005]目前,在很多业务场景中,比如电力问答系统中,需要对于用户提出的问题,从大量文档中找到能够回答该问题的具体内容,比如某句话,或者某个表格中的某几个单元格内容等,进而根据该内容给出准确的答案。相关技术,在获取到用户提出的问题后,通常是通过人工查询大量文档,从中找到能够回答用户问题的具体内容,并根据该具体内容给出答案,或者从FAQ(Frequently Asked Questions,常见问题解答)库中找到与用户问题匹配的答案。上述通过人工查询来回答问题的方式,会浪费大量的人力成本和时间成本,而通过FAQ来回答问题的方式,仅能回答FAQ中已存在的问题,对于FAQ中不存在的问题,无法给出准确的答案。如何以较低的人力成本和时间成本,准确回答用户问题,已经成为一个亟待解决的问题。

技术实现思路

[0006]本申请提供一种答案生成方法、装置、电子设备及存储介质,以解决相关技术中的答案生成方法存在的人力成本和时间成本高,且准确性差的技术问题。
[0007]本申请第一方面实施例提供一种答案生成方法,该方法包括:获取查询语句以及查询语句所属的问题类型;从至少一个文档包括的多个内容片段中,获取与查询语句匹配的目标内容片段;按照问题类型对应的应答策略,基于目标内容片段,生成查询语句对应的目标答案。
[0008]在一些实施例中,问题类型包括数字类、抽取类、判断类中的一个;目标内容片段的数量为多个;按照问题类型对应的应答策略,基于目标内容片段,生成查询语句对应的目
标答案,包括:对于每个目标内容片段,将查询语句与目标内容片段输入自然语言处理NLP领域的抽取模型,以从目标内容片段中抽取查询语句对应的候选答案片段,并获取对应的置信度;根据各候选答案片段对应的置信度,从各候选答案片段中获取目标答案片段;按照问题类型对应的应答策略,基于目标答案片段生成目标答案。
[0009]在一些实施例中,问题类型包括抽取类;按照问题类型对应的应答策略,基于目标答案片段生成目标答案,包括:将目标答案片段作为目标答案。
[0010]在一些实施例中,问题类型包括判断类;按照问题类型对应的应答策略,基于目标答案片段生成目标答案,包括:将目标答案片段和查询语句输入NLP领域的判断模型,以获取查询语句对应的判断结果;将判断结果和/或目标答案片段作为目标答案。
[0011]在一些实施例中,问题类型包括数字类;按照问题类型对应的应答策略,基于目标答案片段生成目标答案,包括:根据预设规则从目标答案片段中获取目标数字,并获取目标数字对应的单位;根据目标数字以及对应的单位,生成目标答案。
[0012]在一些实施例中,问题类型包括统计类;按照问题类型对应的应答策略,基于目标内容片段,生成查询语句对应的目标答案,包括:通过正则表达式抽取规则,对目标内容片段进行抽取,以获取目标答案。
[0013]在一些实施例中,从至少一个文档包括的多个内容片段中,获取与查询语句匹配的目标内容片段之前,还包括:从预设的问答集中获取与查询语句匹配的目标问题;基于NLP领域的第一相关度模型,获取查询语句与目标问题之间的第一相关度;确定第一相关度不大于预设阈值。
[0014]在一些实施例中,方法还包括:在第一相关度大于预设阈值的情况下,从问答集中获取目标问题对应的答案;将目标问题对应的答案,确定为查询语句对应的目标答案。
[0015]在一些实施例中,从至少一个文档包括的多个内容片段中,获取与查询语句匹配的目标内容片段,包括:基于查询语句进行查询,以从多个内容片段中,获取与查询语句相关的多个候选内容片段;基于NLP领域的第二相关度模型,获取查询语句与各候选内容片段之间的第二相关度;基于各第二相关度,从各候选内容片段中获取目标内容片段。
[0016]在一些实施例中,从至少一个文档包括的多个内容片段中,获取与所述查询语句匹配的目标内容片段之前,还包括:基于人工智能AI领域的光学字符识别OCR技术,对各文档进行识别,以获取各文档的识别结果;对各识别结果进行结构化处理,以得到各文档中包括的多个内容片段;将各内容片段与对应的内容字段对应保存。
[0017]在一些实施例中,基于人工智能AI领域的光学字符识别OCR技术,对各文档进行识别,以获取各文档的识别结果,包括:调用RPA机器人将各文档上传至文档处理平台,以基于文档处理平台,采用光学字符识别OCR技术,对各文档进行识别;获取文档处理平台返回的各文档的识别结果。
[0018]本申请第二方面实施例提供一种答案生成装置,包括:第一获取模块,用于获取查询语句以及查询语句所属的问题类型;第二获取模块,用于从至少一个文档包括的多个内容片段中,获取与查询语句匹配的目标内容片段;生成模块,用于按照问题类型对应的应答策略,基于目标内容片段,生成查询语句对应的目标答案。
[0019]在一些实施例中,问题类型包括数字类、抽取类、判断类中的一个;目标内容片段的数量为多个;生成模块,包括:第一获取单元,用于对于每个目标内容片段,将查询语句与
目标内容片段输入自然语言处理NLP领域的抽取模型,以从目标内容片段中抽取查询语句对应的候选答案片段,并获取对应的置信度;第二获取单元,用于根据各候选答案片段对应的置信度,从各候选答案片段中获取目标答案片段;生成单元,用于按照问题类型对应的应答策略,基于目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种答案生成方法,其特征在于,包括:获取查询语句以及所述查询语句所属的问题类型;从至少一个文档包括的多个内容片段中,获取与所述查询语句匹配的目标内容片段;按照所述问题类型对应的应答策略,基于所述目标内容片段,生成所述查询语句对应的目标答案。2.根据权利要求1所述的方法,其特征在于,所述问题类型包括数字类、抽取类、判断类中的一个;所述目标内容片段的数量为多个;所述按照所述问题类型对应的应答策略,基于所述目标内容片段,生成所述查询语句对应的目标答案,包括:对于每个所述目标内容片段,将所述查询语句与所述目标内容片段输入自然语言处理NLP领域的抽取模型,以从所述目标内容片段中抽取所述查询语句对应的候选答案片段,并获取对应的置信度;根据各所述候选答案片段对应的置信度,从各所述候选答案片段中获取目标答案片段;按照所述问题类型对应的应答策略,基于所述目标答案片段生成所述目标答案。3.根据权利要求2所述的方法,其特征在于,所述问题类型包括抽取类;所述按照所述问题类型对应的应答策略,基于所述目标答案片段生成所述目标答案,包括:将所述目标答案片段作为所述目标答案。4.根据权利要求2所述的方法,其特征在于,所述问题类型包括判断类;所述按照所述问题类型对应的应答策略,基于所述目标答案片段生成所述目标答案,包括:将所述目标答案片段和所述查询语句输入NLP领域的判断模型,以获取所述查询语句对应的判断结果;将所述判断结果和/或所述目标答案片段作为所述目标答案。5.根据权利要求2所述的方法,其特征在于,所述问题类型包括数字类;所述按照所述问题类型对应的应答策略,基于所述目标答案片段生成所述目标答案,包括:根据第一预设规则,从所述目标答案片段中获取目标数字,并获取所述目标数字对应的单位;根据所述目标数字以及对应的单位,生成所述目标答案。6.根据权利要求1所述的方法,其特征在于,所述问题类型包括统计类;所述按照所述问题类型对应的应答策略,基于所述目标内容片段,生成所述查询语句对应的目标答案,包括:根据第二预设规则,从所述目标内容片段中抽取得到所述目标答案。7.根据权利要求1

6任一项所述的方法,其特征在于,所述从至少一个文档包括的多个内容片段中,获取与所述查询语句匹配的目标内容片段之前,还包括:从预设的问答集中获取与所述查询语句匹配的目标问题;基于NLP领域的第一相关度模型,获取所述查询语句与所述目标问题之间的第一相关
度;确定所述第一相关度不大于预设阈值。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:在所述第一相关度大于所述预设阈值的情况下,从所述问答集中获取所述目标问题对应的答案;将所述目标问题对应的答案,确定为所述查询语句对应的目标答案。9.根...

【专利技术属性】
技术研发人员:段沛宸
申请(专利权)人:来也科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1