表格问答方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39298711 阅读:23 留言:0更新日期:2023-11-07 11:07
本申请涉及自然语言处理技术领域,公开了一种表格问答方法、装置、电子设备及存储介质,该方法包括:根据查询请求对应的问题文本和目标数据表中的属性,确定第一输入序列;通过编码层对第一输入序列进行编码处理,获得第一输入序列对应的第一编码特征序列;根据第一编码特征序列对问题文本进行语料分类,获得问题文本对应的语料分类结果;若语料分类结果指示问题文本请求查询的数据不在目标数据表中,向查询请求的发起方返回第一提示信息。本申请可以在识别到问题文本请求查询的数据不在目标数据表中的情况下,进行拒识,进而避免获得错误的查询结果,整体上提升了表格问答的准确性。整体上提升了表格问答的准确性。整体上提升了表格问答的准确性。

【技术实现步骤摘要】
表格问答方法、装置、电子设备及存储介质


[0001]本申请涉及自然语言处理
,更具体地,涉及一种表格问答方法、装置、电子设备及存储介质。

技术介绍

[0002]表格问答是自然语言处理技术的一个重要分支,其是通过将自然语言文本转换为结构化查询语句,然后通过执行结构化查询语句在数据库中进行数据查询,获得对应的查询结果,该查询结果包括自然语言文本请求查询的数据。为自然语言文本所生成的结构化查询语句的准确性直接影响所得到查询结果的准确性,相关技术中,存在表格问答过程中,根据为问题文本预测到的结构化查询语句进行查询获得的查询结果不准确的问题。

技术实现思路

[0003]鉴于上述问题,本申请实施例提出了一种表格问答方法、装置、电子设备及存储介质,以解决相关技术中表格问答的准确性低的问题。
[0004]根据本申请实施例的一个方面,提供了一种表格问答方法,包括:根据查询请求对应的问题文本和目标数据表中的属性,确定第一输入序列;通过编码层对所述第一输入序列进行编码处理,获得所述第一输入序列对应的第一编码特征序列;根据所述第一编码特征本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种表格问答方法,其特征在于,包括:根据查询请求对应的问题文本和目标数据表中的属性,确定第一输入序列;通过编码层对所述第一输入序列进行编码处理,获得所述第一输入序列对应的第一编码特征序列;根据所述第一编码特征序列对所述问题文本进行语料分类,获得所述问题文本对应的语料分类结果,所述语料分类结果用于指示所述问题文本请求查询的数据在所述目标数据表中,或所述问题文本请求查询的数据不在所述目标数据表中;若所述语料分类结果指示所述问题文本请求查询的数据不在所述目标数据表中,向所述查询请求的发起方返回第一提示信息,所述第一提示信息用于提示所述问题文本请求查询的数据不在所述目标数据表中。2.根据权利要求1所述的方法,其特征在于,所述第一编码特征序列包括第一子序列和第二子序列,所述第一子序列用于确定所述问题文本的语料分类结果,所述第二子序列用于表示所述第一输入序列的特征;所述根据所述第一编码特征序列对所述问题文本进行语料分类,获得所述问题文本对应的语料分类结果包括:根据所述第一子序列对所述问题文本进行语料分类,获得所述问题文本对应的语料分类结果。3.根据权利要求1所述的方法,其特征在于,所述根据所述第一编码特征序列对所述问题文本进行语料分类,获得所述问题文本对应的语料分类结果之后,所述方法还包括:若所述语料分类结果指示所述问题文本请求查询的数据在所述目标数据表中,通过解码层对所述第一编码特征序列进行解码处理,获得所述问题文本对应的结构化查询语句;执行所述结构化查询语句,以从所述目标数据表中查询获得所述问题文本对应的查询结果;向所述查询请求的发起方返回所述查询结果。4.根据权利要求3所述的方法,其特征在于,所述结构化查询语句中包括所述目标数据表中的属性中的至少一个,且所述结构化查询语句中的属性采用属性的序号表示。5.根据权利要求4所述的方法,其特征在于,所述通过解码层对所述第一编码特征序列进行解码处理,获得所述问题文本对应的结构化查询语句,包括:通过所述解码层根据所述第一编码特征序列逐个字符地进行解码,顺序输出所述结构化查询语句中的各个字符;其中,在解码确定所述结构化查询语句中的首个字符后,将所述结构化查询语句中上一次解码输出的字符输入所述解码层,以使得所述解码层根据所述上一次解码输出的字符和所述第一编码特征序列继续解码以输出下一个字符。6.根据权利要求4所述的方法,其特征在于,所述根据查询请求对应的问题文本与目标数据表中的属性,确定第一输入序列,包括:计算所述问题文本与所述目标数据表中各属性所对应属性名称之间的语义相似度;按照语义相似度由高到低的顺序,将所述目标数据表中的属性进行排序,得到第一属性排序;根据所述问题文本与所述第一属性排序中前N个属性,确定所述第一输入序列;N为大于1的整数。
7.根据权利要求6所述的方法,其特征在于,所述根据所述问题文本与所述第一属性排序中前N个属性,确定所述第一输入序列,包括:将所述前N个属性按照目标编号规则进行编号,确定所述前N个属性中各属性对应的序号,所述目标编号规则与所述目标数据表中的各属性的编号规则不同;将所述问题文本、所述前N个属性对应的属性名称、所述前N个属性对应的序号进行拼接,得到所述第一输入序列。8.根据权利要求3所述的方法,其特征在于,所述结构化查询语句包括在第一属性下的第一属性值,所述第一属性属于所述目标数据表中的属性;所述执行所述结构化查询语句,以从所述目标数据表中查询获得所述问题文本对应的查询结果之前,所述方法还包括:若所述目标数据表中所述第一属性的属性值不包括所述第一属性值,根据所述目标数据表中所述第一属性的属性值对所述结构化查询语句中的所述第一属性值进行修正。9.根据权利要求3所述的方法,其特征在于,所述方法还包括:通过训练数据对所述编码层和所述解码层进行训练;所述训练数据包括正向样本问题文本、所述正向样本问题文本对应的样本结构化查询语句、所述正向样本问题文本对应的样本数据表、所述正...

【专利技术属性】
技术研发人员:张倩汶饶孟良
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1