一种数据查询方法、系统及相关设备技术方案

技术编号：25185180 阅读：17 留言：0更新日期：2020-08-07 21:13

本发明专利技术实施例提供了一种数据查询方法、系统及相关设备，用于实现数据库的自然语言查询功能。本发明专利技术实施例方法包括：将预设BERT模型作为编码器，并设置解码器对所述编码器进行解码得到输出值集合，所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系；采用预设样本数据对所述预设BERT模型及解码器进行训练，得到深度学习模型；接收客户端发送的自然语言查询语句，并采用所述深度学习模型对所述自然语言查询语句进行处理，并根据生成的输出值集合得到过滤条件集合；根据所述过滤条件集合在数据库中查询对应的目标数据，并返回给所述客户端。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据查询方法、系统及相关设备
本专利技术涉及数据库查询
，尤其涉及一种数据查询方法、系统及相关设备。
技术介绍
数据库中存在着海量有价值的结构化数据，现有的数据查询系统往往通过SQL语句来与数据库进行交互查询数据库，或通过精心设计的交互界面，手动的、机械的输入查询条件，即用户输入关键词并选择字段名，然后利用字符串匹配的方法去数据库中匹配相应字段中的数据，以实现查询数据库的目的。现有的查询系统需要用户学习掌握一定的SQL专业知识，并需要用户输入关键词并手动选择字段名，输入方式不符合用户的自然语言表达方式，用户体验不好。
技术实现思路
本专利技术实施例提供了一种数据查询方法、系统及相关设备，用于实现数据库的自然语言查询功能。本专利技术实施例第一方面提供了一种数据查询方法，可包括：将预设BERT模型作为编码器，并设置解码器对所述编码器进行解码得到输出值集合，所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系；采用预设样本数据对所述预设BERT模型及解码器进行训练，得到深度学习模型；接收客户端发送的自然语言查询语句，并采用所述深度学习模型对所述自然语言查询语句进行处理，并根据生成的输出值集合得到过滤条件集合；根据所述过滤条件集合在数据库中查询对应的目标数据，并返回给所述客户端。可选的，作为一种可能的实施方式，每一条所述预设样本数据包括样本ID、自然语言问句、过滤条件的字段名及过滤条件集合，在采用预设...

【技术保护点】
1.一种数据查询方法，其特征在于，包括：/n将预设BERT模型作为编码器，并设置解码器对所述编码器进行解码得到输出值集合，所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系；/n采用预设样本数据对所述预设BERT模型及解码器进行训练，得到深度学习模型；/n接收客户端发送的自然语言查询语句，并采用所述深度学习模型对所述自然语言查询语句进行处理，并根据生成的输出值集合得到过滤条件集合；/n根据所述过滤条件集合在数据库中查询对应的目标数据，并返回给所述客户端。/n

【技术特征摘要】
1.一种数据查询方法，其特征在于，包括：
将预设BERT模型作为编码器，并设置解码器对所述编码器进行解码得到输出值集合，所述输出值集合包括过滤条件数量、过滤条件的字段名、过滤条件对应的操作类型、多个过滤条件的关系；
采用预设样本数据对所述预设BERT模型及解码器进行训练，得到深度学习模型；
接收客户端发送的自然语言查询语句，并采用所述深度学习模型对所述自然语言查询语句进行处理，并根据生成的输出值集合得到过滤条件集合；
根据所述过滤条件集合在数据库中查询对应的目标数据，并返回给所述客户端。

2.根据权利要求1所述的方法，其特征在于，每一条所述预设样本数据包括样本ID、自然语言问句、过滤条件的字段名及过滤条件集合，在采用预设样本数据对所述预设BERT模型及解码器进行训练之前，所述方法还包括：
当识别到预设样本数据中的自然语言问句中包含预设词语时，判断预设词典中是否存在与所述预设词语的相似度大于阈值的目标词语，若存在，则在预设样本数据中记录所述目标词语对应的字段作为过滤条件的字段名；
和/或，当识别到预设样本数据中的自然语言问句中包含预设词语时，判断预设同义词典中是否存在与所述预设词语的相似度大于阈值的同义词语，若存在，则采用所述同义词语替换所述预设词语。

3.根据权利要求1或2所述的方法，其特征在于，在根据所述过滤条件集合在数据库中查询对应的目标数据之前，所述方法还包括：
采用依存句法分析算法对所述自然语言查询语句进行分析计算得到自然语言查询语句中词汇的依存关系，并根据所述依存关系对所述过滤条件集合中的过滤条件进行修正。

4.根据权利要求1或2所述的方法，其特征在于，在根据所述过滤条件集合在数据库中查询对应的目标数据之前，所述方法还包括：
对所述过滤条件集合中的字段值类型进行校验，若字段值类型与对应的目标过滤条件的取值类型不符合，则删除所述目标过滤条件。

5.一种数据查询系统，其特征在于，包括：
深度学习模型，所述深度学习模型以预设BERT模型作为编码器...

【专利技术属性】
技术研发人员：吴粤敏，宁义双，宁可，张刚，彭璐，
申请(专利权)人：金蝶软件中国有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人