一种数据查询方法、系统及相关设备技术方案

技术编号:25185180 阅读:17 留言:0更新日期:2020-08-07 21:13
本发明专利技术实施例提供了一种数据查询方法、系统及相关设备,用于实现数据库的自然语言查询功能。本发明专利技术实施例方法包括:将预设BERT模型作为编码器,并设置解码器对所述编码器进行解码得到输出值集合,所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系;采用预设样本数据对所述预设BERT模型及解码器进行训练,得到深度学习模型;接收客户端发送的自然语言查询语句,并采用所述深度学习模型对所述自然语言查询语句进行处理,并根据生成的输出值集合得到过滤条件集合;根据所述过滤条件集合在数据库中查询对应的目标数据,并返回给所述客户端。

【技术实现步骤摘要】
一种数据查询方法、系统及相关设备
本专利技术涉及数据库查询
,尤其涉及一种数据查询方法、系统及相关设备。
技术介绍
数据库中存在着海量有价值的结构化数据,现有的数据查询系统往往通过SQL语句来与数据库进行交互查询数据库,或通过精心设计的交互界面,手动的、机械的输入查询条件,即用户输入关键词并选择字段名,然后利用字符串匹配的方法去数据库中匹配相应字段中的数据,以实现查询数据库的目的。现有的查询系统需要用户学习掌握一定的SQL专业知识,并需要用户输入关键词并手动选择字段名,输入方式不符合用户的自然语言表达方式,用户体验不好。
技术实现思路
本专利技术实施例提供了一种数据查询方法、系统及相关设备,用于实现数据库的自然语言查询功能。本专利技术实施例第一方面提供了一种数据查询方法,可包括:将预设BERT模型作为编码器,并设置解码器对所述编码器进行解码得到输出值集合,所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系;采用预设样本数据对所述预设BERT模型及解码器进行训练,得到深度学习模型;接收客户端发送的自然语言查询语句,并采用所述深度学习模型对所述自然语言查询语句进行处理,并根据生成的输出值集合得到过滤条件集合;根据所述过滤条件集合在数据库中查询对应的目标数据,并返回给所述客户端。可选的,作为一种可能的实施方式,每一条所述预设样本数据包括样本ID、自然语言问句、过滤条件的字段名及过滤条件集合,在采用预设样本数据对所述预设BERT模型及解码器进行训练之前,本专利技术实施例中的数据查询方法还可以包括:当识别到预设样本数据中的自然语言问句中包含预设词语时,判断预设词典中是否存在与所述预设词语的相似度大于阈值的目标词语,若存在,则在预设样本数据中记录所述目标词语对应的字段作为过滤条件的字段名;和/或,当识别到预设样本数据中的自然语言问句中包含预设词语时,判断预设同义词典中是否存在与所述预设词语的相似度大于阈值的同义词语,若存在,则采用所述同义词语替换所述预设词语。可选的,作为一种可能的实施方式,在根据所述过滤条件集合在数据库中查询对应的目标数据之前,本专利技术实施例中的数据查询方法还可以包括:采用依存句法分析算法对所述自然语言查询语句进行分析计算得到自然语言查询语句中词汇的依存关系,并根据所述依存关系对所述过滤条件集合中的过滤条件进行修正。可选的,作为一种可能的实施方式,在根据所述过滤条件集合在数据库中查询对应的目标数据之前,本专利技术实施例中的数据查询方法还可以包括:对所述过滤条件集合中的字段值类型进行校验,若字段值类型与对应的目标过滤条件的取值类型不符合,则删除所述目标过滤条件。本专利技术实施例第二方面提供了一种数据查询系统,可包括:深度学习模型,所述深度学习模型以预设BERT模型作为编码器,并设置有解码器对所述编码器进行解码得到输出值集合,所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系;训练模块,用于采用预设样本数据对所述深度学习模型进行训练;接收模块,用于接收客户端发送的自然语言查询语句,并采用所述深度学习模型对所述自然语言查询语句进行处理,并根据生成的输出值集合得到过滤条件集合;查询模块,用于根据所述过滤条件集合在数据库中查询对应的目标数据,并返回给所述客户端。可选的,作为一种可能的实施方式,每一条所述预设样本数据包括样本ID、自然语言问句、过滤条件的字段名及过滤条件集合,本专利技术实施例中的数据查询系统,还可以包括:信息增强模块,当识别到预设样本数据中的自然语言问句中包含预设词语时,判断预设词典中是否存在与所述预设词语的相似度大于阈值的目标词语,若存在,则在预设样本数据中记录所述目标词语对应的字段作为过滤条件的字段名;同义词词典模块,当识别到预设样本数据中的自然语言问句中包含预设词语时,判断预设同义词典中是否存在与所述预设词语的相似度大于阈值的同义词语,若存在,则采用所述同义词语替换所述预设词语。可选的,作为一种可能的实施方式,本专利技术实施例中的数据查询系统,还可以包括:分析模块,用于采用依存句法分析算法对所述自然语言查询语句进行分析计算得到自然语言查询语句中词汇的依存关系,并根据所述依存关系对所述过滤条件集合中的过滤条件进行修正。可选的,作为一种可能的实施方式,本专利技术实施例中的数据查询系统,还可以包括:验证模块,用于对所述过滤条件集合中的字段值类型进行校验,若字段值类型与对应的目标过滤条件的取值类型不符合,则删除所述目标过滤条件。本专利技术实施例第三方面提供了一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如第一方面及第一方面中任意一种可能的实施方式中的步骤。本专利技术实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面及第一方面中任意一种可能的实施方式中的步骤。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术实施例中,将预设BERT模型作为编码器,并设置解码器对编码器进行解码得到输出值集合,采用预设样本数据对预设BERT模型及解码器进行训练,得到深度学习模型。当接收客户端发送的自然语言查询语句时,可以采用深度学习模型对自然语言查询语句进行处理,并根据生成的输出值集合得到过滤条件集合,根据过滤条件集合在数据库中查询对应的目标数据,并返回给客户端。相对于现有技术,基于自然语言实现了数据库的数据查询功能,提高了用户体验。附图说明图1为本专利技术实施例中一种数据查询方法的一个实施例示意图;图2为本专利技术实施例中一种数据查询系统的一个实施例示意图;图3为本专利技术实施例中一种计算机装置的一个实施例示意图。具体实施方式本专利技术实施例提供了一种数据查询方法、系统及相关设备,用于实现数据库的自然语言查询功能。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有本文档来自技高网
...

【技术保护点】
1.一种数据查询方法,其特征在于,包括:/n将预设BERT模型作为编码器,并设置解码器对所述编码器进行解码得到输出值集合,所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系;/n采用预设样本数据对所述预设BERT模型及解码器进行训练,得到深度学习模型;/n接收客户端发送的自然语言查询语句,并采用所述深度学习模型对所述自然语言查询语句进行处理,并根据生成的输出值集合得到过滤条件集合;/n根据所述过滤条件集合在数据库中查询对应的目标数据,并返回给所述客户端。/n

【技术特征摘要】
1.一种数据查询方法,其特征在于,包括:
将预设BERT模型作为编码器,并设置解码器对所述编码器进行解码得到输出值集合,所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系;
采用预设样本数据对所述预设BERT模型及解码器进行训练,得到深度学习模型;
接收客户端发送的自然语言查询语句,并采用所述深度学习模型对所述自然语言查询语句进行处理,并根据生成的输出值集合得到过滤条件集合;
根据所述过滤条件集合在数据库中查询对应的目标数据,并返回给所述客户端。


2.根据权利要求1所述的方法,其特征在于,每一条所述预设样本数据包括样本ID、自然语言问句、过滤条件的字段名及过滤条件集合,在采用预设样本数据对所述预设BERT模型及解码器进行训练之前,所述方法还包括:
当识别到预设样本数据中的自然语言问句中包含预设词语时,判断预设词典中是否存在与所述预设词语的相似度大于阈值的目标词语,若存在,则在预设样本数据中记录所述目标词语对应的字段作为过滤条件的字段名;
和/或,当识别到预设样本数据中的自然语言问句中包含预设词语时,判断预设同义词典中是否存在与所述预设词语的相似度大于阈值的同义词语,若存在,则采用所述同义词语替换所述预设词语。


3.根据权利要求1或2所述的方法,其特征在于,在根据所述过滤条件集合在数据库中查询对应的目标数据之前,所述方法还包括:
采用依存句法分析算法对所述自然语言查询语句进行分析计算得到自然语言查询语句中词汇的依存关系,并根据所述依存关系对所述过滤条件集合中的过滤条件进行修正。


4.根据权利要求1或2所述的方法,其特征在于,在根据所述过滤条件集合在数据库中查询对应的目标数据之前,所述方法还包括:
对所述过滤条件集合中的字段值类型进行校验,若字段值类型与对应的目标过滤条件的取值类型不符合,则删除所述目标过滤条件。


5.一种数据查询系统,其特征在于,包括:
深度学习模型,所述深度学习模型以预设BERT模型作为编码器...

【专利技术属性】
技术研发人员:吴粤敏宁义双宁可张刚彭璐
申请(专利权)人:金蝶软件中国有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1