一种数据查询方法、装置及计算机可读存储介质制造方法及图纸

技术编号:33773857 阅读:18 留言:0更新日期:2022-06-12 14:26
本发明专利技术公开了一种数据查询方法、装置及计算机可读存储介质,所述方法包括:获取自然语言查询语句,从所述自然语言查询语句中提取关键信息片段;基于所述关键信息片段在预置的表关键信息库中查询,得到匹配的候选表关键信息,根据所述候选表关键信息确定候选表集合及所述候选表集合中各候选表对应的特征表征参数;将所述自然语言查询语句和所述候选表对应的特征表征参数输入预置的表匹配模型,得到每个所述候选表和所述自然语言查询语句的匹配得分;根据所述匹配得分返回查询结果。本发明专利技术可实现根据自然语言查询语句查询表结构数据,降低检索门槛,便于普通人员检索。便于普通人员检索。便于普通人员检索。

【技术实现步骤摘要】
一种数据查询方法、装置及计算机可读存储介质


[0001]本专利技术涉及自然语言处理和深度神经网络
,具体涉及一种数据查询方法、装置及计算机可读存储介质。

技术介绍

[0002]随着数据库技术的发展,数据库中存储的数据量呈爆发式增长,表结构作为最常见的业务数据存储形式,在数据库中占据很大的数据比重,如何在海量的表结构数据中精准检索到所需数据成为研究热点之一。
[0003]在目前的表结构数据检索实践中,通常需要用户写SQL语句以实现数据查找,而SQL语言需要一定编程基础,具有较高的检索门槛,给检索活动带来不便。

技术实现思路

[0004]本专利技术解决的问题是现有的表结构数据检索需要用户写SQL语句才能实现数据查找,具有较高的检索门槛。
[0005]本专利技术提出一种数据查询方法,包括:
[0006]获取自然语言查询语句,从所述自然语言查询语句中提取关键信息片段;
[0007]基于所述关键信息片段在预置的表关键信息库中查询,得到匹配的候选表关键信息,根据所述候选表关键信息确定候选表集合及所述候选表集合中各候选表对应的特征表征参数;
[0008]将所述自然语言查询语句和所述候选表对应的特征表征参数输入预置的表匹配模型,得到每个所述候选表和所述自然语言查询语句的匹配得分;
[0009]根据所述匹配得分返回查询结果。
[0010]可选地,所述关键信息片段包括表名片段、表头名片段和/或数据片段;所述表关键信息库包括存储表名、表头名以及表中的数据的索引库
[0011]可选地,当基于所述关键信息片段查询到所述候选表不存在对应数据时,所述候选表对应的特征表征参数包括所述候选表的表名;当基于所述关键信息片段查询到所述候选表存在对应数据时,所述候选表对应的特征表征参数包括所述候选表的表名和基于所述关键信息片段查询到的所述候选表中的对应数据。
[0012]可选地,所述将所述自然语言查询语句和所述候选表对应的特征表征参数输入预置的表匹配模型,得到每个所述候选表和所述自然语言查询语句的匹配得分包括:
[0013]将所述自然语言查询语句进行编码,得到查询向量;
[0014]将所述候选表的特征表征参数进行编码得到表向量,其中,当基于所述关键信息片段查询到所述候选表不存在对应数据时,将所述候选表的表名,或者表名和表别名,进行编码得到所述表向量,当基于所述关键信息片段查询到所述候选表存在对应数据时,将所述候选表的表名,或者表名和表别名,进行编码得到第一向量,将基于所述关键信息片段查询到的所述候选表中的对应数据进行编码得到第二向量,基于所述第一向量和所述第二向
量得到所述表向量;
[0015]将所述查询向量和所述表向量进行匹配,得到所述候选表和所述自然语言查询语句的匹配得分。
[0016]可选地,所述基于所述第一向量和所述第二向量得到所述表向量包括:
[0017]采用注意力机制,生成所述第一向量和所述第二向量各自的重要性得分;
[0018]根据所述重要性得分将所述第一向量和所述第二向量进行加权计算,得到所述表向量。
[0019]可选地,所述基于所述关键信息片段在预置的表关键信息库中查询,得到匹配的候选表关键信息,根据所述候选表关键信息确定候选表集合及所述候选表集合中各候选表对应的特征表征参数包括:
[0020]分别基于所述关键信息片段和所述自然语言查询语句在所述表关键信息库中进行模糊匹配,得到与所述关键信息片段匹配的第一候选表关键信息和与所述自然语言查询语句匹配的第二候选表关键信息;
[0021]将所述第一候选表关键信息和所述第二候选表关键信息去重合并,得到第三候选表关键信息;
[0022]根据所述第三候选表关键信息确定所述候选表集合及所述候选表集合中各候选表对应的特征表征参数。
[0023]可选地,所述从所述自然语言查询语句中提取关键信息片段包括:
[0024]将所述自然语言查询语句输入预置的实体识别模型,得到识别出的所述关键信息片段,其中,所述实体识别模型用于识别所述自然语言查询语句中的实体,所述实体的类型包括表名实体类别、表头实体类别和数据实体类别。
[0025]可选地,所述根据所述匹配得分返回查询结果包括:
[0026]依照所述匹配得分将所述查询结果降序排列,并基于排列后的所述查询结果生成SQL语句返回。
[0027]本专利技术还提出一种数据查询装置,包括存储有计算机程序的计算机可读存储介质和处理器,所述计算机程序被所述处理器读取并运行时,实现如上所述的数据查询方法。
[0028]本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器读取并运行时,实现如上所述的数据查询方法。
[0029]本专利技术通过基于从自然语言查询语句中提取的关键信息片段,在预置的表关键信息库中查询,得到候选表集合,再将自然语言查询语句和候选表集合中的候选表输入预置的表匹配模型,得到每个候选表和自然语言查询语句的匹配得分,最后根据匹配得分返回查询结果,由此,实现根据自然语言查询语句查询表结构数据,降低检索门槛,便于普通人员检索,此外,通过获得每个候选表和自然语言查询语句的匹配得分,根据匹配得分返回查询结果,可实现将查询得到的表按照匹配得分排序输出,使用户快速获得最为匹配的查询结果,降低用户查找目标数据的时间,提升检索效率。
附图说明
[0030]图1为本专利技术实施例数据查询方法一流程示意图;
[0031]图2为本专利技术实施例数据查询方法中实体识别模型的示意图;
[0032]图3为本专利技术实施例数据查询方法中表匹配模型的一示意图。
具体实施方式
[0033]为使本专利技术的上述目的、特征和优点能够更为明显易懂,下面结合附图对本专利技术的具体实施例做详细的说明。
[0034]如图1,在本专利技术一实施例中,所述数据查询方法包括:
[0035]步骤S100,获取自然语言查询语句,从所述自然语言查询语句中提取关键信息片段。
[0036]自然语言查询语句,即自然语言形式的查询语句,自然语言是用户最常使用的表达形式,本专利技术实施例采用自然语言查询语句作为原始输入,可大大降低检索门槛,满足绝大部分用户的检索需求。
[0037]用户在检索系统中输入自然语言查询语句后,检索系统获取自然语言查询语句,将输入的自然语言查询语句中描述表、描述表头和描述数据的语句部分解析出来作为关键信息片段。其中,表、表头、数据是表结构数据的三个层级,表头包含行头和列头,将自然语言查询语句按照表结构数据的三个层级进行解析,便于后续步骤中,将自然语言查询语句与数据库中的表按照表结构数据的三个层级进行匹配,可提高检索效率,降低表结构数据的检索难度。本专利技术实施例中的检索系统可采用ES(elastic search)搜索引擎。
[0038]可选地,所述从所述自然语言查询语句中提取关键信息片段包括:将所述自然语言查询语句输入预置的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据查询方法,其特征在于,包括:获取自然语言查询语句,从所述自然语言查询语句中提取关键信息片段;基于所述关键信息片段在预置的表关键信息库中查询,得到匹配的候选表关键信息,根据所述候选表关键信息确定候选表集合及所述候选表集合中各候选表对应的特征表征参数;将所述自然语言查询语句和所述候选表对应的特征表征参数输入预置的表匹配模型,得到每个所述候选表和所述自然语言查询语句的匹配得分;根据所述匹配得分返回查询结果。2.如权利要求1所述的数据查询方法,其特征在于,所述关键信息片段包括表名片段、表头名片段和/或数据片段;所述表关键信息库包括存储表名、表头名以及表中的数据的索引库。3.如权利要求1或2所述的数据查询方法,其特征在于,当基于所述关键信息片段查询到所述候选表不存在对应数据时,所述候选表对应的特征表征参数包括所述候选表的表名;当基于所述关键信息片段查询到所述候选表存在对应数据时,所述候选表对应的特征表征参数包括所述候选表的表名和基于所述关键信息片段查询到的所述候选表中的对应数据。4.如权利要求1或2所述的数据查询方法,其特征在于,所述将所述自然语言查询语句和所述候选表对应的特征表征参数输入预置的表匹配模型,得到每个所述候选表和所述自然语言查询语句的匹配得分包括:将所述自然语言查询语句进行编码,得到查询向量;将所述候选表的特征表征参数进行编码得到表向量,其中,当基于所述关键信息片段查询到所述候选表不存在对应数据时,将所述候选表的表名,或者表名和表别名,进行编码得到所述表向量,当基于所述关键信息片段查询到所述候选表存在对应数据时,将所述候选表的表名,或者表名和表别名,进行编码得到第一向量,将基于所述关键信息片段查询到的所述候选表中的对应数据进行编码得到第二向量,基于所述第一向量和所述第二向量得到所述表向量;将所述查询向量和所述表向量进行匹配,得到所述候选表和所述自然语言查询语句的匹配得分。5.如权利要求4所述的数据查询方法,其特征...

【专利技术属性】
技术研发人员:肖志李秉坤王杰陈昌根
申请(专利权)人:三一集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1