逻辑表达式生成方法、模型训练方法、装置及介质制造方法及图纸

技术编号:37419865 阅读:11 留言:0更新日期:2023-04-30 09:42
本公开提供了一种逻辑表达式生成方法、模型训练方法、装置及介质,涉及人工智能技术领域,尤其涉及文本数据处理、深度学习、自然语言处理和问答系统领域。实现方案为:基于问题文本、至少一个目标文档以及多个函数标签,确定第一文本序列;基于第一文本序列,获取第一编码向量;对第一编码向量和第一标签进行融合编码,获取第一融合向量;基于第一融合向量,预测第一函数标签;将第一标签更新为第一函数标签;基于更新后的第一标签,重复执行生成操作,直至预测得到第一预设函数的全部输入;以及基于第一预设函数以及第一预设函数的全部输入,确定用于解答问题文本的逻辑表达式,以基于逻辑表达式获得问题文本的答案。辑表达式获得问题文本的答案。辑表达式获得问题文本的答案。

【技术实现步骤摘要】
逻辑表达式生成方法、模型训练方法、装置及介质


[0001]本公开涉及人工智能
,尤其涉及文本数据处理、深度学习、自然语言处理和问答系统领域,具体涉及一种基于文本数据生成逻辑表达式的方法、模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]随着信息技术的飞速发展,海量的互联网信息不断涌现,无论是数据样式还是数据种类都变得繁多,给互联网用户带来更加丰富多样信息的同时加大了用户信息获取的难度。而问答系统能够基于用户的问题自动检索并输入问题的答案,能够一定程度上降低用户信息获取的难度。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种基于文本数据生成逻辑表达式的方法、模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面,提供了一种基于文本数据生成逻辑表达式的方法,包括:获取问题文本以及与问题文本相应的至少一个目标文档;基于问题文本、至少一个目标文档以及多个函数标签,确定第一文本序列,其中,多个函数标签分别与多个用于执行逻辑操作的预设函数相应,多个预设函数中的每个预设函数包括至少一个输入,至少一个输入中的每个输入具有相应的预设数据格式;对第一文本序列进行编码,以获取第一编码向量;对第一编码向量和第一标签进行融合编码,以获取第一融合向量,第一标签为表达式起始符,表达式起始符用于引导逻辑表达式中的首个函数标签的生成;基于第一融合向量,预测得到第一函数标签,第一函数标签对应第一预设函数;将第一标签更新为第一函数标签;基于更新后的第一标签,重复执行生成操作,直至预测得到第一预设函数的全部输入,生成操作包括:对第一融合向量和第一标签进行融合编码,以更新第一融合向量;基于更新后的第一融合向量,预测得到第一预设函数的具备相应预设数据格式的第一输入;以及将第一标签更新为第一输入;以及基于第一预设函数以及第一预设函数的全部输入,确定用于解答问题文本的逻辑表达式,以基于逻辑表达式获得问题文本的答案。
[0007]根据本公开的另一方面,提供了一种模型训练方法,包括:获取样本问题、与样本
问题相应的至少一个样本文档以及与样本问题相应的逻辑表达式;基于样本问题、至少一个样本文档以及多个函数标签,确定第一文本序列,其中,多个函数标签分别与多个用于执行逻辑操作的预设函数相应,多个预设函数中的每个预设函数包括至少一个输入,至少一个输入中的每个输入具有相应的预设数据格式;将第一文本序列输入模型的第一编码网络,以获取第一编码网络输出的第一编码向量;将第一编码向量和第一标签输入模型的融合编码网络,以获取融合编码网络输出的第一融合向量,第一标签为表达式起始符,表达式起始符用于引导逻辑表达式中的首个函数标签的生成;将第一融合向量输入模型的解码网络,以获得解码网络输出的第一函数标签,第一函数标签对应第一预设函数;将第一标签更新为第一函数标签;基于更新后的第一标签,重复执行生成操作,直至预测得到第一预设函数的全部输入,生成操作包括:将第一融合向量和第一标签输入融合编码网络,以获取融合编码网络输出的更新后的第一融合向量;将更新后的第一融合向量输入解码网络,以获得解码网络输出的第一预设函数的具备相应预设数据格式的第一输入;以及将第一标签更新为第一输入;基于第一预设函数以及第一预设函数的全部输入,确定表达式预测结果;以及基于逻辑表达式和表达式预测结果,训练模型的第一编码网络、融合编码网络以及解码网络。
[0008]根据本公开的另一方面,提供了一种基于文本数据生成逻辑表达式的装置,包括:第一获取单元,被配置为获取问题文本以及与问题文本相应的至少一个目标文档;第一确定单元,被配置为基于问题文本、至少一个目标文档以及多个函数标签,确定第一文本序列,其中,多个函数标签分别与多个用于执行逻辑操作的预设函数相应,多个预设函数中的每个预设函数包括至少一个输入,至少一个输入中的每个输入具有相应的预设数据格式;第一编码单元,被配置为对第一文本序列进行编码,以获取第一编码向量;第二编码单元,被配置为对第一编码向量和第一标签进行融合编码,以获取第一融合向量,第一标签为表达式起始符,表达式起始符用于引导逻辑表达式中的首个函数标签的生成;第一预测单元,被配置为基于第一融合向量,预测得到第一函数标签,第一函数标签对应第一预设函数;第一更新单元,被配置为将第一标签更新为第一函数标签;第一执行单元,被配置为基于更新后的第一标签,重复执行下述子单元所执行的生成操作,直至预测得到第一预设函数的全部输入,执行单元包括:第一编码子单元,被配置为对第一融合向量和第一标签进行融合编码,以更新第一融合向量;第一预测子单元,被配置为基于更新后的第一融合向量,预测得到第一预设函数的具备相应预设数据格式的第一输入;以及第一更新子单元,被配置为将第一标签更新为第一输入;以及第二确定单元,被配置为基于第一预设函数以及第一预设函数的全部输入,确定用于解答问题文本的逻辑表达式,以基于逻辑表达式获得问题文本的答案。
[0009]根据本公开的另一方面,提供了一种模型训练装置,包括:第一获取单元,被配置为获取样本问题、与样本问题相应的至少一个样本文档以及与样本问题相应的逻辑表达式;第一确定单元,被配置为基于样本问题、至少一个样本文档以及多个函数标签,确定第一文本序列,其中,多个函数标签分别与多个用于执行逻辑操作的预设函数相应,多个预设函数中的每个预设函数包括至少一个输入,至少一个输入中的每个输入具有相应的预设数据格式;第一输入单元,被配置为将第一文本序列输入模型的第一编码网络,以获取第一编码网络输出的第一编码向量;第二输入单元,被配置为将第一编码向量和第一标签输入模
型的融合编码网络,以获取融合编码网络输出的第一融合向量,第一标签为表达式起始符,表达式起始符用于引导逻辑表达式中的首个函数标签的生成;第三输入单元,被配置为将第一融合向量输入模型的解码网络,以获得解码网络输出的第一函数标签,第一函数标签对应第一预设函数;第一更新单元,被配置为将第一标签更新为第一函数标签;第一执行单元,被配置为基于更新后的第一标签,重复执行下述子单元所执行的生成操作,直至预测得到第一预设函数的全部输入,第一执行单元包括:第一输入子单元,被配置为将第一融合向量和第一标签输入融合编码网络,以获取融合编码网络输出的更新后的第一融合向量;第二输入子单本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本数据生成逻辑表达式的方法,包括:获取问题文本以及与所述问题文本相应的至少一个目标文档;基于所述问题文本、所述至少一个目标文档以及多个函数标签,确定第一文本序列,其中,所述多个函数标签分别与多个用于执行逻辑操作的预设函数相应,所述多个预设函数中的每个预设函数包括至少一个输入,所述至少一个输入中的每个输入具有相应的预设数据格式;对所述第一文本序列进行编码,以获取第一编码向量;对所述第一编码向量和第一标签进行融合编码,以获取第一融合向量,所述第一标签为表达式起始符,所述表达式起始符用于引导所述逻辑表达式中的首个函数标签的生成;基于所述第一融合向量,预测得到第一函数标签,所述第一函数标签对应第一预设函数;将所述第一标签更新为所述第一函数标签;基于更新后的第一标签,重复执行生成操作,直至预测得到所述第一预设函数的全部输入,所述生成操作包括:对所述第一融合向量和所述第一标签进行融合编码,以更新所述第一融合向量;基于更新后的第一融合向量,预测得到所述第一预设函数的具备相应预设数据格式的第一输入;以及将所述第一标签更新为所述第一输入;以及基于所述第一预设函数以及所述第一预设函数的全部输入,确定用于解答所述问题文本的所述逻辑表达式,以基于所述逻辑表达式获得所述问题文本的答案。2.根据权利要求1所述的方法,其中,所述多个预设函数中的每个预设函数还包括至少一个输出,并且所述至少一个输出中的每个输出具有相应的预设数据格式,所述第一预设函数的输入包括第二预设函数的输出,所述方法还包括:基于所述第一融合向量和所述第一函数标签进行融合编码,以获取第二融合向量;基于所述第二融合向量,预测得到第二函数标签,所述第二函数标签对应所述第二预设函数,并且,所述第二预设函数的输出与所述第一预设函数的输入具有相同的数据格式;以及将所述第一标签更新为所述第二函数标签,以基于更新后的第一标签,重复执行所述生成操作,直至预测得到所述第一预设函数的全部输入和所述第二预设函数的全部输入。3.根据权利要求1或2所述的方法,其中,所述多个预设函数用于执行下述逻辑操作中的至少一者:信息抽取、数值计算、数值比较和数据排序。4.根据权利要求1

3中任一项所述的方法,其中,所述获取问题文本以及与所述问题文本相应的至少一个目标文档包括:获取所述问题文本;以及基于所述问题文本,在多个预置文档中确定所述至少一个目标文档。5.根据权利要求4所述的方法,所述多个预置文档中包括由表格转化得到的至少一个第一文档,所述至少一个第一文档的获取包括:获取至少一个表格;以及将所述至少一个表格中每个表格的至少一行表格数据或至少一列表格数据按照预设
格式整理为文档数据,以获取至少一个第一文档。6.一种模型训练方法,包括:获取样本问题、与所述样本问题相应的至少一个样本文档以及与所述样本问题相应的逻辑表达式;基于所述样本问题、所述至少一个样本文档以及多个函数标签,确定第一文本序列,其中,所述多个函数标签分别与多个用于执行逻辑操作的预设函数相应,所述多个预设函数中的每个预设函数包括至少一个输入,所述至少一个输入中的每个输入具有相应的预设数据格式;将所述第一文本序列输入所述模型的第一编码网络,以获取所述第一编码网络输出的第一编码向量;将所述第一编码向量和第一标签输入所述模型的融合编码网络,以获取所述融合编码网络输出的第一融合向量,所述第一标签为表达式起始符,所述表达式起始符用于引导所述逻辑表达式中的首个函数标签的生成;将所述第一融合向量输入所述模型的解码网络,以获得所述解码网络输出的第一函数标签,所述第一函数标签对应第一预设函数;将所述第一标签更新为所述第一函数标签;基于更新后的第一标签,重复执行生成操作,直至预测得到所述第一预设函数的全部输入,所述生成操作包括:将所述第一融合向量和所述第一标签输入所述融合编码网络,以获取所述融合编码网络输出的更新后的第一融合向量;将更新后的第一融合向量输入所述解码网络,以获得所述解码网络输出的所述第一预设函数的具备相应预设数据格式的第一输入;以及将所述第一标签更新为所述第一输入;基于所述第一预设函数以及所述第一预设函数的全部输入,确定表达式预测结果;以及基于所述逻辑表达式和所述表达式预测结果,训练所述模型的所述第一编码网络、所述融合编码网络以及所述解码网络。7.根据权利要求6所述的方法,其中,所述多个预设函数中的每个预设函数还包括至少一个输出,并且所述至少一个输出中的每个输出具有相应的预设数据格式,所述第一预设函数的输入包括第二预设函数的输出,所述方法还包括:将所述第一融合向量和所述第一函数标签输入所述融合编码网络,以获取所述融合编码网络输出的第二融合向量;将所述第二融合向量输入所述解码网络,以获得所述解码网络输出的第二函数标签,所述第二函数标签对应所述第二预设函数,并且,所述第二预设函数的输出与所述第一预设函数的输入具有相同的数据格式;以及将所述第一标签更新为所述第二函数标签,以基于更新后的第一标签,重复执行所述生成操作,直至预测得到所述第一预设函数的全部输入和所述第二预设函数的全部输入。8.根据权利要求6或7所述的方法,其中,所述多个预设函数用于执行下述逻辑操作中的至少一者:信息抽取、数值计算、数值比较和数据排序。
9.一种基于文本数据生成逻辑表达式的装置,包括:第一获取单元,被配置为获取问题文本以及与所述问题文本相应的至少一个目标文档;第一确定单元,被配置为基于所述问题文本、所述至少一个目标文档以及多个函数标签,确定第一文本序列,其中,所述多个函数标签分别与多个用于执行逻辑操作的预设函数相应,所述多个预设函数中的每个预设函数包括至少一个输入,所述至少一个输入中的每个输入具有相应的预设数据格式;第一编码单元,被配置为对所述第一文本序列进行编码,以获取第一编码向量;第二编码单元,被配置为对所述第一编码向量和第一标签进行融合编码,以获取第一融合向量,所述第一标签为表达式起始符,所述表达式起始符用于引导所述逻辑表达式中的首个函数标签的生成;第一预测单元,被配置为基于...

【专利技术属性】
技术研发人员:吴锟王丽杰常月刘璟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1