一种智能问答处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36942864 阅读:13 留言:0更新日期:2023-03-22 19:04
本申请公开一种智能问答处理方法、装置、电子设备及存储介质,涉及自然语言处理技术领域。该方法包括:响应于输入问题文本的用户操作,对所述问题文本进行意图识别,确定所述问题文本的意图信息;对所述问题文本进行实体识别,确定所述问题文本的实体信息,所述实体信息包括所述问题文本中的关键词;根据所述意图信息以及所述问题文本的关键词,确定所述问题文本的第一结构化查询SQL语句;基于NL2SQL模型,将所述问题文本转换为第二SQL语句;根据所述第一SQL语句和所述第二SQL语句,确定所述问题文本的目标SQL语句,实现对问题文本处理的准确率。准确率。准确率。

【技术实现步骤摘要】
一种智能问答处理方法、装置、电子设备及存储介质


[0001]本申请涉及自然语言处理
,尤其涉及一种智能问答处理方法、装置、电子设备及存储介质。

技术介绍

[0002]智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本。基于对网站多年积累的关于各行业的基本情况常见问题及其解答,整理为规范的问答库形式,以支撑各种形式问题的智能问答。方便了用户,提高了办事效率,提升了企业形象。
[0003]目前,在智能问答系统中,一般就是响应于用户输入的问题文本,将该问题文本转换为对应的结构化查询语言(Structured Query Language,SQL)语句,执行转换后的SQL语句,便可得到该问题文本的答案数据。该方案,在相对较为简单的操作时,可能准确率相对较好,但是处理语义较为复杂的文本或者内容不清晰的文本时,准确率则相对较低。
[0004]因此,在处理用户输入的问题文本时,如何提高对问题文本处理的准确率是目前亟需解决的问题。

技术实现思路

[0005]本发申请提供了一种智能问答处理方法,用以提高对问题文本处理的准确率。
[0006]第一方面,提供一种智能问答处理方法,包括:
[0007]响应于输入问题文本的用户操作,对所述问题文本进行意图识别,确定所述问题文本的意图信息;对所述问题文本进行实体识别,确定所述问题文本的实体信息,所述实体信息包括所述问题文本中的关键词;根据所述意图信息以及所述问题文本中的关键词,确定所述问题文本的第一SQL语句;基于NL2SQL模型,将所述问题文本转换为第二SQL语句;根据所述第一SQL语句和所述第二SQL语句,确定所述问题文本的目标SQL语句。
[0008]可选的,所述对所述问题文本进行实体识别,确定所述问题文本的实体信息,包括:
[0009]对所述问题文本进行实体识别,确定所述问题文本的i个特征以及所述i个特征的位置信息,所述i为大于0的整数;根据所述i个特征以及所述i个特征的位置信息,确定所述问题文本的实体信息。
[0010]可选的,所述根据所述意图信息以及所述问题文本中的关键词,确定所述问题文本的第一SQL语句,包括:
[0011]根据所述意图信息以及所述关键词查询数据库,得到与所述问题文本相关联的第一信息列表;其中,所述第一信息列表包括与所述意图信息和/或与所述关键词相关的候选SQL语句;基于统计算法,从所述候选SQL语句中筛选出与所述问题文本匹配的第一SQL语句。
[0012]可选的,所述根据所述第一SQL语句和所述第二SQL语句,确定所述问题文本的目标SQL语句,包括:
[0013]若所述第一SQL语句与所述第二SQL语句之间的相似度满足要求,则将所述第一SQL语句和所述第二SQL语句中的任意一个作为所述问题文本的目标SQL语句;若所述第一SQL语句与所述第二SQL语句之间的相似度不满足要求,则确定所述第一SQL语句的得分是否大于设定阈值,若是,则将所述第一SQL语句作为所述问题文本的目标SQL语句,否则,将所述第二SQL语句作为所述问题文本的目标SQL语句。
[0014]可选的,所述对所述问题文本进行意图识别之前,还包括:
[0015]对所述问题文本执行以下至少一种预处理操作:
[0016]将所述问题文本中的文字转化为指定类型的文字;若所述问题文本中包括错别字,则对所述错别字进行纠正;若所述问题文本中包括时间信息,则将所述时间信息转化为指定格式的时间信息;将所述问题文本中的标点符号转化为英文类型的标点符号;基于停用词表将所述问题文本中的助词删除;基于分词词典,将所述问题文本进行分词。
[0017]可选的,所述根据所述第一SQL语句和所述第二SQL语句,确定所述问题文本的目标SQL语句之后,还包括:
[0018]执行所述目标SQL语句,输出执行结果,所述执行结果用于指示所述问题文本的答案。
[0019]第二方面,提供一种智能问答处理装置,包括:
[0020]意图识别模块,用于响应于输入问题文本的用户操作,对所述问题文本进行意图识别,确定所述问题文本的意图信息;实体识别模块,用于对所述问题文本进行实体识别,确定所述问题文本的实体信息,所述实体信息包括所述问题文本中的关键词;第一确定模块,用于根据所述意图信息以及所述问题文本中的关键词,确定所述问题文本的第一SQL语句;转换模块,用于基于NL2SQL模型,将所述问题文本转换为第二SQL语句;第二确定模块,用于根据所述第一SQL语句和所述第二SQL语句,确定所述问题文本的目标SQL语句。
[0021]可选的,所述第一确定模块,具体用于:
[0022]根据所述意图信息以及所述实体信息查询数据库,得到与所述问题文本相关联的第一信息列表;其中,所述第一信息列表包括与所述意图信息和/或与所述实体信息相关的候选SQL语句;基于统计算法,从所述候选SQL语句中筛选出与所述问题文本匹配的第一SQL语句。
[0023]可选的,所述第二确定模块,具体用于:
[0024]若所述第一SQL语句与所述第二SQL语句之间的相似度满足要求,则将所述第一SQL语句和所述第二SQL语句中的任意一个作为所述问题文本的目标SQL语句;若所述第一SQL语句与所述第二SQL语句之间的相似度不满足要求,则确定所述第一SQL语句的得分是否大于设定阈值,若是,则将所述第一SQL语句作为所述问题文本的目标SQL语句,否则,将所述第二SQL语句作为所述问题文本的目标SQL语句。
[0025]可选的,所述装置还包括预处理模块;
[0026]所述预处理模块,用于对所述问题文本执行以下至少一种预处理操作:
[0027]将所述问题文本中的文字转化为指定类型的文字;若所述问题文本中包括错别字,则对所述错别字进行纠正;若所述问题文本中包括时间信息,则将所述时间信息转化为
指定格式的时间信息;将所述问题文本中的标点符号转化为英文类型的标点符号;基于停用词表将所述问题文本中的助词删除;基于分词词典,将所述问题文本进行分词。
[0028]可选的,所述装置还包括SQL语句操作模块;所述SQL语句操作模块,用于执行所述目标SQL语句,输出执行结果,所述执行结果用于指示所述问题文本的答案。
[0029]第三方面,提供一种电子设备,包括:
[0030]存储器,用于存放计算机程序;处理器,用于执行所述存储器上所存放的计算机程序时,实现第一方面中任一项所述的方法步骤。
[0031]第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项所述的方法步骤。
[0032]本申请实施例中,由于响应于输入问题文本的用户操作,对该问题文本进行意图识别,确定问题文本的意图信息;对问题文本进行实体识别,确定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能问答处理方法,其特征在于,包括:响应于输入问题文本的用户操作,对所述问题文本进行意图识别,确定所述问题文本的意图信息;对所述问题文本进行实体识别,确定所述问题文本的实体信息,所述实体信息包括所述问题文本中的关键词;根据所述意图信息以及所述问题文本中的关键词,确定所述问题文本的第一结构化查询SQL语句;基于NL2SQL模型,将所述问题文本转换为第二SQL语句;根据所述第一SQL语句和所述第二SQL语句,确定所述问题文本的目标SQL语句。2.如权利要求1所述的方法,其特征在于,所述对所述问题文本进行实体识别,确定所述问题文本的实体信息,包括:对所述问题文本进行实体识别,确定所述问题文本的i个特征以及所述i个特征的位置信息,所述i为大于0的整数;根据所述i个特征以及所述i个特征的位置信息,确定所述问题文本的实体信息。3.如权利要求1所述的方法,其特征在于,所述根据所述意图信息以及所述问题文本中的关键词,确定所述问题文本的第一SQL语句,包括:根据所述意图信息以及所述关键词查询数据库,得到与所述问题文本相关联的第一信息列表;其中,所述第一信息列表包括与所述意图信息和/或与所述关键词相关的候选SQL语句;基于统计算法,从所述候选SQL语句中筛选出与所述问题文本匹配的第一SQL语句。4.如权利要求1所述的方法,其特征在于,所述根据所述第一SQL语句和所述第二SQL语句,确定所述问题文本的目标SQL语句,包括:若所述第一SQL语句与所述第二SQL语句之间的相似度满足要求,则将所述第一SQL语句和所述第二SQL语句中的任意一个作为所述问题文本的目标SQL语句;若所述第一SQL语句与所述第二SQL语句之间的相似度不满足要求,则确定所述第一SQL语句的得分是否大于设定阈值,若是,则将所述第一SQL语句作为所述问题文本的目标SQL语句,否则,将所述第二SQL语句作为所述问题文本的目标SQL语句。5.如权利要求1

4任一项所述的方法,其特征在于,所述对所述问题文本进行意图识别之前,还包括:对所述问题文本执行以下至少一种预处理操作:将所述问题文本中的文字转化为指定类型的文字;若所述问题文本中包括错别字,则对所述错别字进行纠正;若所述问题文本中包括时间信息,则将所述时间信息转化为指定格式的时间信息;将所述问题文本中的标点符号转化为英文类型的标点符号;基于停用词表将所述问题文本中的助词删除;基于分词词典,将所述问题文本进行分词。6.如权利要求1

4任一项所述的方法,其特征在于,所述根据所述第一SQL语句和所述第二SQL语句,确定所述问题文本的目标SQL语句之后,还包括:执行所述目标SQL语句,输出执行结果,所述执行结果用于指示所述问题文本的答案。
7.一种智能问答处理装置,其特征在于,包括:意图识别模块,用于响应于输入问题文本的用户操作,对所述问题文本进行意图识别,确定所述问题文本的意图信...

【专利技术属性】
技术研发人员:李宏伟林文辉张研王志刚周辉潘厚玉王晶
申请(专利权)人:安徽航天信息科技有限公司安徽航天信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1