本发明专利技术实施例提供一种数据查询方法、装置、电子设备及存储介质,所述方法包括:获取自然语言的文本信息;将所述文本信息输入到预先训练好的预测网络中进行预测,得到预测槽值对,所述槽值对包含与目标数据库对应的查询子句以及查询内容;基于的所述预测槽值对,构建目标数据库的查询命令;根据所述查询命令查询在所述目标数据库中进行数据查询,并输出查询结果。通过对自然语言的文本信息进行预测,得到预测槽值进行查询命令的构建,由于预测槽值对应目标数据库的查询子句以及查询内容,使得到数据库的查询可以通过自然语言进行,不必用户清楚知道数据库的查询策略以及查询语句,就可以对数据库进行查询,降低了数据库查询的难度。
Data query methods, devices, electronic equipment and storage media
【技术实现步骤摘要】
数据查询方法、装置、电子设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种数据查询方法、装置、电子设备及存储介质。
技术介绍
在数据库查询技术中,数据库用户通过构建固定模式的查询语句,在数据库中进行数据查询,以得到对应查询语句的数据。然而,由于数据库查询策略的设定以及查询语句的固定化,对于不熟悉数据库的用户而言,无法清楚的短简该数据库的查询策略以及查询语句,使得数据库的查询具有一定的难度,需要进行一定程度的培训,这无疑加大了数据库的使用难度。因此,现有的数据库存在使用难度较高的问题。
技术实现思路
本专利技术实施例提供一种数据查询识别方法,能够降低数据库的使用难度。第一方面,本专利技术实施例提供一种数据查询方法,包括:获取自然语言的文本信息;将所述文本信息输入到预先训练好的预测网络中进行预测,得到预测槽值对,所述槽值对包含与目标数据库对应的查询子句以及查询内容;基于的所述预测槽值对,构建目标数据库的查询命令;根据所述查询命令查询在所述目标数据库中进行数据查询,并输出查询结果。可选的,所述槽值对包括槽名与槽值,所述槽名与目标数据库中查询子句具有第一映射关系,所述槽值与目标数据库中查询内容具有第二映射关系,所述基于的所述预测槽值对,构建目标数据库的查询命令,包括:根据所述槽名,通过所述第一映射关系映射得到目标数据表的查询子句;以及根据所述槽值,通过所述第二映射关系映射得到目标数据表的查询内容;根据所述查询子句与所述查询内容,构建目标数据库的查询命令。可选的,所述目标数据库中包括数据表,所述数据表包括数据属性,所述将所述文本信息输入到预先训练好的预测网络中进行预测,得到预测槽值对,包括:将所述文本信息进行预处理,以得到预设词长的查询文本;将所述预设词长的查询文本以及所述数据属性通过预先训练好的编码网络进行编码,得到查询文本的词向量;将所述查询文本的词向量依次输入预先训练好的长短时记忆网络获取具有上下文信息的特征向量;将所述特征向量输入预先训练好的注意力机制,得到注意力向量;将所述注意力向量输入到预先训练好的全连接层,对所述注意力向量进行分类,得到预设数据个预测槽值对。可选的,所述目标数据库中包括数据表,所述数据表包括数据属性,所述预测网络的训练,包括:获取预设词长的语料文本作为训练样本;将所述训练样本与所述数据属性在编码后进行拼接,并输入到所述预测网络中对所述预测网络进行训练,以使所述预测网络输出与所述训练样本的槽值对标签相同的槽值对。可选的,所述数据表还包括数据类型,所述获取预设词长的查询文本,包括:统计数据集中所有语料样本的文本词长,以及统计所述目标数据库中数据类型的分类数量,以及每个数据类型对应的数据属性的属性数量;根据预设语料样本比例,选取最大查询文本,所述最大查询文本包括最大文本词长,最大分类数量,以及每个表头对应的最大属性数量;通过所述最大查询文本,对所有语料样本的文本词长及分类数量进行预处理,得到预设词长的查询文本,所述查询文本满足最大查询文本的文本词长及分类数量。可选的,所述通过所述最大查询文本,对所有语料样本的文本词长及分类数量进行预处理,得到预设词长的查询文本,包括:判断语料样本中的文本词长是否满足所述最大文本词长;若所述语料样本中的文本词长不满足所述最大文件词长,则将所述语料样本进行填充,得到预设词长的查询文本。第二方面,本专利技术实施例提供一种数据查询装置,包括:获取模块,用于获取自然语言的文本信息;预测模块,用于将所述文本信息输入到预先训练好的预测网络中进行预测,得到预测槽值对,所述槽值对包含与目标数据库对应的查询子句以及查询内容;构建模块,用于基于的所述预测槽值对,构建目标数据库的查询命令;查询模块,用于根据所述查询命令查询在所述目标数据库中进行数据查询,并输出查询结果。第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本专利技术实施例提供的数据查询方法中的步骤。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现专利技术实施例提供的数据查询方法中的步骤。本专利技术实施例中,获取自然语言的文本信息;将所述文本信息输入到预先训练好的预测网络中进行预测,得到预测槽值对,所述槽值对包含与目标数据库对应的查询子句以及查询内容;基于的所述预测槽值对,构建目标数据库的查询命令;根据所述查询命令查询在所述目标数据库中进行数据查询,并输出查询结果。通过对自然语言的文本信息进行预测,得到预测槽值进行查询命令的构建,由于预测槽值对应目标数据库的查询子句以及查询内容,使得到数据库的查询可以通过自然语言进行,不必用户清楚知道数据库的查询策略以及查询语句,就可以对数据库进行查询,降低了数据库查询的难度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种数据查询方法的流程图;图2是本专利技术实施例提供的一种数据表的结构示意图;图3是本专利技术实施例提供的一种槽值对的结构示意图;图4是本专利技术实施例提供的一种字牌编码的示意图;图5是本专利技术实施例提供的一种预测网络的训练方法的流程图;图6是本专利技术实施例提供的一种预测槽值对与查询命令的关系示意图;图7是本专利技术实施例提供的一种数据查询装置的结构示意图;图8是本专利技术实施例提供的另一种数据查询装置的结构示意图;图9是本专利技术实施例提供的另一种数据查询装置的结构示意图;图10是本专利技术实施例提供的另一种数据查询装置的结构示意图;图11是本专利技术实施例提供的另一种数据查询装置的结构示意图;图12是本专利技术实施例提供的另一种数据查询装置的结构示意图;图13是本专利技术实施例提供的一种电子设备的结构示意图;图14是本专利技术实施例提供的一种预测网络的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参见图1,图1是本专利技术实施例提供的一种数据查询方法的流程图,如图1所示,包括以下步骤:101、获取自然语言的文本信息。其中,上述的自然语言可以是用户语音或用户上传的图像,上述的本文档来自技高网...
【技术保护点】
1.一种数据查询方法,其特征在于,包括以下步骤:/n获取自然语言的文本信息;/n将所述文本信息输入到预先训练好的预测网络中进行预测,得到预测槽值对,所述槽值对包含与目标数据库对应的查询子句以及查询内容;/n基于所述预测槽值对,构建目标数据库的查询命令;/n根据所述查询命令查询在所述目标数据库中进行数据查询,并输出查询结果。/n
【技术特征摘要】
1.一种数据查询方法,其特征在于,包括以下步骤:
获取自然语言的文本信息;
将所述文本信息输入到预先训练好的预测网络中进行预测,得到预测槽值对,所述槽值对包含与目标数据库对应的查询子句以及查询内容;
基于所述预测槽值对,构建目标数据库的查询命令;
根据所述查询命令查询在所述目标数据库中进行数据查询,并输出查询结果。
2.如权利要求1所述的方法,其特征在于,所述槽值对包括槽名与槽值,所述槽名与目标数据库中查询子句具有第一映射关系,所述槽值与目标数据库中查询内容具有第二映射关系,所述基于所述预测槽值对,构建目标数据库的查询命令,包括:
根据所述槽名,通过所述第一映射关系映射得到目标数据表的查询子句;以及
根据所述槽值,通过所述第二映射关系映射得到目标数据表的查询内容;
根据所述查询子句与所述查询内容,构建目标数据库的查询命令。
3.如权利要求1所述的方法,其特征在于,所述目标数据库中包括数据表,所述数据表包括数据属性,所述将所述文本信息输入到预先训练好的预测网络中进行预测,得到预测槽值对,包括:
将所述文本信息进行预处理,以得到预设词长的查询文本;
将所述预设词长的查询文本以及所述数据属性通过预先训练好的编码网络进行编码,得到查询文本的词向量;
将所述查询文本的词向量依次输入预先训练好的长短时记忆网络获取具有上下文信息的特征向量;
将所述特征向量输入预先训练好的注意力机制,得到注意力向量;
将所述注意力向量输入到预先训练好的全连接层,对所述注意力向量进行分类,得到预设数据个预测槽值对。
4.如权利要求1所述的方法,其特征在于,所述目标数据库中包括数据表,所述数据表包括数据属性,所述预测网络的训练,包括:
获取预设词长的语料文本作为训练样本;
将所述训练样本与所述数据属性在编码后进行拼接,并输入到所述预测网络中对所述预测网络进行训练,以使所述预测网络输出与所述训练样本的槽值对标签相同的槽值对。
5.如权利要求4所述的方法,其特征在于,所述数据表还包括数据类型,所述获取预设词长的查询文本,包括:
统计数据集中所有语料样本的文本词长,以及统计所述目标数据库中数据类型的...
【专利技术属性】
技术研发人员:张成,胡文泽,王孝宇,
申请(专利权)人:深圳云天励飞技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。