数据召回方法及装置制造方法及图纸

技术编号:36157973 阅读:13 留言:0更新日期:2022-12-31 20:05
本说明书提供数据召回方法及装置,其中所述数据召回方法包括:获取查询语句以及多个待召回数据表;基于查询语句,确定各待召回数据表的项目匹配指标,并根据预设表关联关系,确定各待召回数据表的表关联指标,其中,预设表关联关系表征各待召回数据表之间的数据关联;分别根据各待召回数据表的项目匹配指标和表关联指标,确定各待召回数据表的召回评估结果;根据各待召回数据表的召回评估结果,从各待召回数据表中召回目标数据表。通过将表关联关系融入召回评估结果计算机制中,提高了数据召回的准确性。在召回过程中,应用项目匹配指标到召回评估结果的计算中,增强了对查询语句的理解,进一步提高了数据召回的准确性。进一步提高了数据召回的准确性。进一步提高了数据召回的准确性。

【技术实现步骤摘要】
数据召回方法及装置


[0001]本说明书涉及计算机
,特别涉及数据召回方法及装置。

技术介绍

[0002]随着语音识别、自然语言理解等技术的不断发展,自动将自然语言或语音转化为可执行程序,进而执行并获取数据,成为令人关注的研究和应用领域之一,因此,自然语言转结构化查询语句应运而生。自然语言转结构化查询语句应用广泛,能够辅助人们完成数据库查询。
[0003]现有技术中,在使用自然语言转结构化查询语句进行数据召回时,忽视数据表之间的关联关系,导致数据召回效果较差,进而需要更简单更便捷的方法进行数据召回的操作或者处理。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种数据召回方法。本说明书同时涉及一种数据召回装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种数据召回方法,包括:
[0006]获取查询语句以及多个待召回数据表;
[0007]基于所述查询语句,确定各待召回数据表的项目匹配指标,并根据预设表关联关系,确定所述各待召回数据表的表关联指标,其中,所述预设表关联关系表征所述各待召回数据表之间的数据关联;
[0008]分别根据所述各待召回数据表的项目匹配指标和表关联指标,确定所述各待召回数据表的召回评估结果;
[0009]根据所述各待召回数据表的召回评估结果,从所述各待召回数据表中召回目标数据表。
[0010]根据本说明书实施例的第二方面,提供了一种数据召回装置,包括:
[0011]获取模块,被配置为获取查询语句以及多个待召回数据表;
[0012]第一确定模块,被配置为基于所述查询语句,确定各待召回数据表的项目匹配指标,并根据预设表关联关系,确定所述各待召回数据表的表关联指标,其中,所述预设表关联关系表征所述各待召回数据表之间的数据关联;
[0013]第二确定模块,被配置为分别根据所述各待召回数据表的项目匹配指标和表关联指标,确定所述各待召回数据表的召回评估结果;
[0014]召回模块,被配置为根据所述各待召回数据表的召回评估结果,从所述各待召回数据表中召回目标数据表。
[0015]根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0016]存储器和处理器;
[0017]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
[0018]获取查询语句以及多个待召回数据表;
[0019]基于所述查询语句,确定各待召回数据表的项目匹配指标,并根据预设表关联关系,确定所述各待召回数据表的表关联指标,其中,所述预设表关联关系表征所述各待召回数据表之间的数据关联;
[0020]分别根据所述各待召回数据表的项目匹配指标和表关联指标,确定所述各待召回数据表的召回评估结果;
[0021]根据所述各待召回数据表的召回评估结果,从所述各待召回数据表中召回目标数据表。
[0022]根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述数据召回方法的步骤。
[0023]本说明书提供的数据召回方法,获取查询语句以及多个待召回数据表;基于所述查询语句,确定各待召回数据表的项目匹配指标,并根据预设表关联关系,确定所述各待召回数据表的表关联指标,其中,所述预设表关联关系表征所述各待召回数据表之间的数据关联;分别根据所述各待召回数据表的项目匹配指标和表关联指标,确定所述各待召回数据表的召回评估结果;根据所述各待召回数据表的召回评估结果,从所述各待召回数据表中召回目标数据表。通过将表关联关系融入召回评估结果计算机制中,提高了数据召回的准确性。在召回过程中,应用项目匹配指标到召回评估结果的计算中,增强了对查询语句的理解,进一步提高了数据召回的准确性。
附图说明
[0024]图1是本说明书一实施例提供的一种数据召回方法的流程图;
[0025]图2是本说明书一实施例提供的一种数据召回方法的处理流程图;
[0026]图3A是本说明书一实施例提供的一种数据召回方法中的关联框架的结构图;
[0027]图3B是本说明书一实施例提供的一种数据召回方法中的属性示例图;
[0028]图4是本说明书一实施例提供的一种应用于存储查询场景的数据召回方法的处理流程图;
[0029]图5是本说明书一实施例提供的一种数据召回装置的结构示意图;
[0030]图6是本说明书一实施例提供的一种计算设备的结构框图。
具体实施方式
[0031]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0032]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含
一个或多个相关联的列出项目的任何或所有可能组合。
[0033]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的字组“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0034]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0035]结构化查询语言(SQL,Structured Query Language),是用于访问和处理数据库的标准的计算机语言。
[0036]自然语言转结构化查询语句(NL2SQL,Natural Language to SQL),是一种可以将用户的自然语句转化为可执行SQL的智能问答技术,能够有效辅助用户完成数据库查询,改善用户与数据库间的交互体验。
[0037]基于变换器的双向编码器(BERT,Bidirectional Encoder Representation from Transformers),是一种预训练的语言表征模型,其模型架构基于多层双向转换解码。
[0038]BM25(Okapi BM25),是信息索引领域用来计算问句与文档相似度得分的算法。
[0039]然后,对本说明书提供的数据召回方法进行简要说明。
[0040]随着计算机技术的不断发展,越来越多的领域使用关系型数据库,如Oracle数据库、My本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据召回方法,其特征在于,包括:获取查询语句以及多个待召回数据表;基于所述查询语句,确定各待召回数据表的项目匹配指标,并根据预设表关联关系,确定所述各待召回数据表的表关联指标,其中,所述预设表关联关系表征所述各待召回数据表之间的数据关联;分别根据所述各待召回数据表的项目匹配指标和表关联指标,确定所述各待召回数据表的召回评估结果;根据所述各待召回数据表的召回评估结果,从所述各待召回数据表中召回目标数据表。2.根据权利要求1所述的方法,其特征在于,所述基于所述查询语句,确定各待召回数据表的项目匹配指标,包括:对所述查询语句进行字段识别,得到多个候选项;将所述多个候选项分别与各待召回数据表进行匹配,确定所述各待召回数据表的项目匹配指标。3.根据权利要求2所述的方法,其特征在于,所述候选项包括主体、属性和实体类型中的至少一种;所述对所述查询语句进行字段识别,得到多个候选项,包括以下至少一种:对所述查询语句进行分词处理,得到分词结果;根据所述分词结果、预设主体树和主体匹配策略,识别所述查询语句中的主体;对所述查询语句进行分词处理,得到分词结果;根据所述分词结果、预设属性树和属性匹配策略,识别所述查询语句中的属性;对所述查询语句进行分词处理,得到分词结果;根据所述分词结果和命名实体识别策略,识别所述查询语句中不同字段的实体类型,其中,所述实体类型包括主体类型和属性类型。4.根据权利要求2或3所述的方法,其特征在于,所述将所述多个候选项分别与各待召回数据表进行匹配,确定所述各待召回数据表的项目匹配指标,包括:针对每个候选项,根据该候选项与挂靠信息,确定该候选项分别与各待召回数据表的匹配关系,其中,所述挂靠信息表征候选项与待召回数据表的对应信息;基于所述匹配关系和所述候选项的字段长度,确定所述各待召回数据表的项目匹配指标。5.根据权利要求4所述的方法,其特征在于,所述根据所述多个候选项与挂靠信息,确定所述多个候选项分别与各待召回数据表的匹配关系,包括以下至少一种:在所述挂靠信息包含主体挂靠信息的情况下,根据所述多个候选项和所述主体挂靠信息,确定所述多个候选项与所述各待召回数据表的主体项目匹配关系;在所述挂靠信息包含属性挂靠信息的情况下,根据所述多个候选项和所述属性挂靠信息,确定所述多个候选项与所述各待召回数据表的属性项目匹配关系。6.根据权利要求5所述的方法,其特征在于,所述主体挂靠信息包括主体名称挂靠信息和主体类型挂靠信息;所述根据所述多个候选项和所述主体挂靠信息,确定所述多个候选项与所述各待召回
数据表的主体项目匹配关系,包括:在所述多个候选项包括主体的情况下,根据所述主体和主体名称挂靠信息,确定各待召回数据表与所述主体的主体匹配关系;在所述多个候选项包括主体类型的情况下,根据所述主体类型和主体类型挂靠信息,确定各待召回数据表与所述主体类型的主体类型匹配关系。7.根据权利要求5所述的方法,其特征在于,所述属性挂靠信息包括属性名称挂靠信息和属性类型挂靠信息;所述根据所述多个候选项和所述属性挂靠信息,确定所述多个候选项与所述各待召回数据表的属性项目匹配关系,包括:在所述多个候选项包括属性的情况下,根据所述属性和属性名称挂靠信息,确定各待召回数据表与所述属性的属性匹配关系;在所述多个候选项包括属...

【专利技术属性】
技术研发人员:张少杰娄东方林金曙成帆
申请(专利权)人:恒生电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1