查询语句生成方法及装置、模型训练方法、设备、介质制造方法及图纸

技术编号:35354722 阅读:28 留言:0更新日期:2022-10-26 12:29
本实施例涉及人工智能技术领域,尤其涉及一种查询语句生成方法及装置、模型训练方法、设备、介质。该查询语句生成方法包括:获取对话记录以及数据库信息,对话记录包括第一对话信息以及第二对话信息,第一对话信息包括对话记录中最新发出的对话信息,第二对话信息包括对话记录中除第一对话信息之外的对话信息。获取语句生成模型,语句生成模型包括编码模块和生成模块。将第一对话信息和数据库信息输入编码模块中进行编码处理,得到目标序列信息。将第二对话信息和数据库信息输入编码模块中进行编码处理,得到历史序列信息。将对话记录、目标序列信息和历史序列信息输入生成模块中进行语句生成,得到目标查询语句,从而提升生成查询语句的准确性。询语句的准确性。询语句的准确性。

【技术实现步骤摘要】
查询语句生成方法及装置、模型训练方法、设备、介质


[0001]本申请涉及人工智能
,尤其涉及一种查询语句生成方法及装置、模型训练方法、设备、介质。

技术介绍

[0002]随着大数据的发展,通过自然语言与数据库交互成为新的技术热点。目前,从用户的自然语言中提取关键词,可以根据关键词生成查询语句,从而利用查询语句从数据库的海量数据中快速查询用户所需的内容,但这种方式容易丢失复杂的语义信息,导致生成查询语句的准确性较低。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种查询语句生成方法及装置、模型训练方法、设备、介质,能够提升生成查询语句的准确性。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种查询语句生成方法,所述方法包括:
[0005]获取对话记录以及数据库信息,所述对话记录包括第一对话信息以及第二对话信息,所述第一对话信息包括所述对话记录中最新发出的对话信息,所述第二对话信息包括所述对话记录中除所述第一对话信息之外的对话信息;获取语句生成模型,所述语句生成模型包括编码模块和生成模块;将所述第一对话信息和所述数据库信息输入所述编码模块中进行编码处理,得到目标序列信息;将所述第二对话信息和所述数据库信息输入所述编码模块中进行编码处理,得到历史序列信息;将所述对话记录、所述目标序列信息和所述历史序列信息输入所述生成模块中进行语句生成,得到目标查询语句。
[0006]一些实施方式中,所述编码模块包括编码网络、第一注意力网络和序列生成网络;所述将所述第一对话信息和所述数据库信息输入所述编码模块中进行编码处理,得到目标序列信息,包括:
[0007]将所述第一对话信息和所述数据库信息输入所述编码网络中进行词向量编码,得到所述第一对话信息对应的第一词向量和所述数据库信息对应的第二词向量;将所述第一词向量和所述第二词向量输入所述第一注意力网络中进行处理,得到第一注意力结果;将所述第一词向量和所述第一注意力结果输入所述序列生成网络中进行处理,得到目标序列信息。
[0008]一些实施方式中,所述数据库信息包括至少一个数据表的表名和所述数据表的数据项信息,所述数据项信息用于确定所述数据表中包括的数据项,所述第二词向量包括所述数据表对应的第一子向量和所述数据项信息对应的第二子向量;所述将所述第一词向量和所述第二词向量输入所述第一注意力网络中进行处理,得到第一注意力结果,包括:
[0009]将所述第一词向量和所述第一子向量输入所述第一注意力网络中进行处理,得到第一注意力结果;将所述第一词向量和所述第二子向量输入所述第一注意力网络中进行处
理,得到第二注意力结果;将所述第一注意力结果和所述第二注意力结果确定为第一注意力结果。
[0010]一些实施方式中,所述将所述第一对话信息和所述数据库信息输入所述编码网络中进行词向量编码,得到所述第一对话信息对应的第一词向量和所述数据库信息对应的第二词向量,包括:
[0011]对所述第一对话信息进分词处理,得到分词集合;从所述数据库信息中获取至少一个数据表的表名以及所述数据表的数据项信息,所述数据项信息用于确定所述数据表中包括的数据项;根据所有所述表名,构建表集合;根据所述数据表的数据项信息,构建数据项集合;将所述分词集合、所述表集合和所述数据项集合拼接为输入序列;将所述输入序列输入所述编码网络中进行词向量编码,得到所述第一对话信息对应的第一词向量和所述数据库信息对应的第二词向量。
[0012]一些实施方式中,所述生成模块包括第二注意力网络、拼接模块和解码模块;所述将所述对话记录、所述目标序列信息和所述历史序列信息输入所述生成模块中进行语句生成,得到目标查询语句,包括:
[0013]将所述目标序列信息输入所述第二注意力网络中进行处理,得到所述目标序列信息对应的第一权重信息;通过所述拼接模块,对所述第一权重信息和所述对话记录进行拼接处理,得到语句特征向量;将所述语句特征向量输入所述解码模块中进行解码处理,得到目标查询语句。
[0014]一些实施方式中,所述通过所述拼接模块,对所述第一权重信息和所述对话记录进行拼接处理,得到语句特征向量,包括:
[0015]从所述第二对话信息中获取历史提问信息以及历史答复信息,所述历史答复信息用于答复所述历史提问信息;根据所述历史提问信息和所述第一对话信息,分析所述历史答复信息对应的反馈信息,所述反馈信息用于表示所述历史答复信息与所述历史提问信息之间的匹配程度;根据所述反馈信息,确定所述历史答复信息的第二权重信息;通过所述拼接模块,对所述第一权重信息、所述第二权重信息和所述对话记录进行拼接处理,得到语句特征向量。
[0016]为实现上述目的,本申请实施例的第二方面提出了一种模型训练方法,用于训练如本申请实施例的第一方面所述的语句生成模型,所述方法包括:
[0017]获取对话样本以及所述对话样本对应的初始查询语句,其中,所述对话样本包括至少两条对话信息;获取数据库信息,并根据所述数据库信息,确定查询语法规则;根据所述查询语法规则,将所述初始查询语句转换为参考查询语句,所述参考查询语句满足所述查询语法规则对应的语法结构;将所述对话样本、所述数据库信息和所述参考查询语句输入预设生成模型中进行训练处理,得到语句生成模型。
[0018]为实现上述目的,本申请实施例的第三方面提出了一种查询语句生成装置,所述装置包括:
[0019]第一获取模块,用于获取对话记录以及数据库信息,所述对话记录包括第一对话信息以及第二对话信息,所述第一对话信息包括所述对话记录中最新发出的对话信息,所述第二对话信息包括所述对话记录中除所述第一对话信息之外的对话信息;以及,获取语句生成模型,所述语句生成模型包括编码模块和生成模块;
[0020]第一编码模块,用于将所述第一对话信息和所述数据库信息输入所述编码模块中进行编码处理,得到目标序列信息;
[0021]第二编码模块,用于将所述第二对话信息和所述数据库信息输入所述编码模块中进行编码处理,得到历史序列信息;
[0022]生成模块,用于将所述对话记录、所述目标序列信息和所述历史序列信息输入所述生成模块中进行语句生成,得到目标查询语句。
[0023]为实现上述目的,本申请实施例的第四方面提出了一种电子设备,包括至少一个存储器;
[0024]至少一个处理器;
[0025]至少一个计算机程序;
[0026]所述计算机程序被存储在所述存储器中,处理器执行所述至少一个计算机程序以实现:
[0027]如第一方面实施例任一项所述的查询语句生成方法;或者
[0028]如第二方面实施例所述的模型训练方法。
[0029]为实现上述目的,本申请实施例的第五方面还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行:
[0030]如第一方面实施例任一项所述的查询语句生成方法;或者
[0031]如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种查询语句生成方法,其特征在于,所述方法包括:获取对话记录以及数据库信息,所述对话记录包括第一对话信息以及第二对话信息,所述第一对话信息包括所述对话记录中最新发出的对话信息,所述第二对话信息包括所述对话记录中除所述第一对话信息之外的对话信息;获取语句生成模型,所述语句生成模型包括编码模块和生成模块;将所述第一对话信息和所述数据库信息输入所述编码模块中进行编码处理,得到目标序列信息;将所述第二对话信息和所述数据库信息输入所述编码模块中进行编码处理,得到历史序列信息;将所述对话记录、所述目标序列信息和所述历史序列信息输入所述生成模块中进行语句生成,得到目标查询语句。2.根据权利要求1所述的方法,其特征在于,所述编码模块包括编码网络、第一注意力网络和序列生成网络;所述将所述第一对话信息和所述数据库信息输入所述编码模块中进行编码处理,得到目标序列信息,包括:将所述第一对话信息和所述数据库信息输入所述编码网络中进行词向量编码,得到所述第一对话信息对应的第一词向量和所述数据库信息对应的第二词向量;将所述第一词向量和所述第二词向量输入所述第一注意力网络中进行处理,得到第一注意力结果;将所述第一词向量和所述第一注意力结果输入所述序列生成网络中进行处理,得到目标序列信息。3.根据权利要求2所述的方法,其特征在于,所述数据库信息包括至少一个数据表的表名和所述数据表的数据项信息,所述数据项信息用于确定所述数据表中包括的数据项,所述第二词向量包括所述数据表对应的第一子向量和所述数据项信息对应的第二子向量;所述将所述第一词向量和所述第二词向量输入所述第一注意力网络中进行处理,得到第一注意力结果,包括:将所述第一词向量和所述第一子向量输入所述第一注意力网络中进行处理,得到第一处理结果;将所述第一词向量和所述第二子向量输入所述第一注意力网络中进行处理,得到第二处理结果;将所述第一处理结果和所述第二处理结果拼接为第一注意力结果。4.根据权利要求2所述的方法,其特征在于,所述将所述第一对话信息和所述数据库信息输入所述编码网络中进行词向量编码,得到所述第一对话信息对应的第一词向量和所述数据库信息对应的第二词向量,包括:对所述第一对话信息进分词处理,得到分词集合;从所述数据库信息中获取至少一个数据表的表名以及所述数据表的数据项信息,所述数据项信息用于确定所述数据表中包括的数据项;根据所有所述表名,构建表集合;根据所述数据表的数据项信息,构建数据项集合;将所述分词集合、所述表集合和所述数据项集合拼接为输入序列;
将所述输入序列输入所述编码网络中进行词向量编码,得到所述第一对话信息对应的第一词向量和所述数据库信息对应的第二词向量。5.根据权利要求1至4任一项所述的方法,其特征在于,所述生成模块包括第二注意力网络、拼接模块和解码模块;所述将所述对话记录、所述目标序列信...

【专利技术属性】
技术研发人员:于凤英王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1