文本信息的转换方法、装置、可读介质和电子设备制造方法及图纸

技术编号:32133859 阅读:38 留言:0更新日期:2022-01-29 19:38
本公开涉及一种文本信息的转换方法、装置、可读介质和电子设备,涉及电子信息处理技术,该方法包括:获取查询文本信息,将查询文本信息与目标表格的表格信息,按照预设格式拼接为信息序列,表格信息包括目标表格的列名和列类型,利用预先训练的转换模型,根据信息序列确定对应的表征向量,并根据表征向量确定查询文本信息对应的查询指令,表征向量包括信息序列的文本表征、类型表征和位置表征,转换模型为按照预设的蒸馏损失对基础模型进行知识蒸馏得到的,基础模型根据多个训练文本信息,以及每个训练文本信息对应的训练查询指令训练得到。本公开通过对基础模型进行知识蒸馏得到转换模型,在保证转换准确率的前提下,能够提高转换效率。高转换效率。高转换效率。

【技术实现步骤摘要】
文本信息的转换方法、装置、可读介质和电子设备


[0001]本公开涉及电子信息处理
,具体地,涉及一种文本信息的转换方法、装置、可读介质和电子设备。

技术介绍

[0002]随着大数据、云计算等电子信息技术的迅猛发展,相应带来的数据量也呈现爆发式的增长。为了便于后续对数据的处理,海量的数据通常存储在数据库中。当用户需要使用数据库中的数据时,通常需要先编写结构化的数据库查询指令才能与数据库进行交互,以获取满足具体需求的数据。查询指令的编写比较复杂,具有一定的技术门槛,给用户带来了不便。因此,通过语义理解,将自然语言转换为查询指令,能够降低数据库查询的技术门槛,简化查询操作的复杂度。通常情况下,需要通过多任务或者抽象语法树等方式来实现对自然语言的转换,相应的参数规模往往非常庞大,转换效率较低,很难适用于现实场景。

技术实现思路

[0003]提供该部分内容以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该部分内容并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本信息的转换方法,其特征在于,所述方法包括:获取查询文本信息;将所述查询文本信息与目标表格的表格信息,按照预设格式拼接为信息序列,所述表格信息包括所述目标表格的列名和列类型;利用预先训练的转换模型,根据所述信息序列确定对应的表征向量,并根据所述表征向量确定所述查询文本信息对应的查询指令,所述表征向量包括所述信息序列的文本表征、类型表征和位置表征,所述转换模型为按照预设的蒸馏损失对基础模型进行知识蒸馏得到的,所述基础模型根据多个训练文本信息,以及每个所述训练文本信息对应的训练查询指令训练得到。2.根据权利要求1所述的方法,其特征在于,所述转换模型包括:嵌入层、编码层和解码层;所述利用预先训练的转换模型,根据所述信息序列确定对应的表征向量,并根据所述表征向量确定所述查询文本信息对应的查询指令,包括:将所述信息序列输入所述嵌入层,以得到所述嵌入层输出的所述信息序列的文本表征、类型表征和位置表征,并根据所述信息序列的文本表征、类型表征和位置表征,生成所述表征向量;将所述表征向量输入所述编码层,以得到所述编码层输出的所述表征向量对应的编码向量,所述编码向量用于表征所述查询文本信息,与所述目标表格的列名之间的链接关系;将所述编码向量输入所述解码层,以根据所述解码层的输出确定所述查询指令。3.根据权利要求2所述的方法,其特征在于,所述解码层包括多个解码器;所述将所述编码向量输入所述解码层,以根据所述解码层的输出确定所述查询指令,包括:将所述编码向量分别输入多个所述解码器,以得到每个所述解码器输出的解码结果;根据多个所述解码器对应的解码结果,确定查询片段包括的目标列和目标函数,并根据多个所述解码器对应的解码结果,确定条件片段包括的目标条件;根据所述查询片段和所述条件片段,确定所述查询指令。4.根据权利要求3所述的方法,其特征在于,所述解码层包括:第一查询解码器、第二查询解码器和第三查询解码器;所述第一查询解码器对应的解码结果用于指示所述目标列的数量;所述第二查询解码器对应的解码结果用于指示所述目标表格中的至少一个所述目标列;所述第三查询解码器对应的解码结果用于指示每个所述目标列对应的所述目标函数;所述根据多个所述解码器对应的解码结果,确定查询片段包括的目标列和目标函数,包括:根据所述第一查询解码器、所述第二查询解码器和所述第三查询解码器对应的解码结果,确定所述查询片段。5.根据权利要求3所述的方法,其特征在于,所述解码层包括:第一条件解码器、第二条件解码器、第三条件解码器、第四条件解码器、第五条件解码器和第六条件解码器;所述第一条件解码器对应的解码结果用于指示所述目标条件的数量,以及每个所述目标条件之间的关联关系;
所述第二条件解码器对应的解码结果用于指示所述目标表格中,每个所述目标条件对应的查询列;所述第三条件解码器对应的解码结果用于指示每个所述目标条件对应的查询操作符;所述第四条件解码器对应的解码结果用于指示每个所述目标条件对应的查询值;所述第五条件解码器对应的解码结果用于指示每个所述目标条件对应的查询列与查询值的匹配度;所述第六条件解码器对应的解码结果用于指示每个所述目标条件对应的嵌套查询标识;所述...

【专利技术属性】
技术研发人员:徐叶琛安哲成吴培昊马泽君
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1