逻辑表达式生成方法、模型训练方法、装置及介质制造方法及图纸

技术编号：37419865 阅读：11 留言：0更新日期：2023-04-30 09:42

本公开提供了一种逻辑表达式生成方法、模型训练方法、装置及介质，涉及人工智能技术领域，尤其涉及文本数据处理、深度学习、自然语言处理和问答系统领域。实现方案为：基于问题文本、至少一个目标文档以及多个函数标签，确定第一文本序列；基于第一文本序列，获取第一编码向量；对第一编码向量和第一标签进行融合编码，获取第一融合向量；基于第一融合向量，预测第一函数标签；将第一标签更新为第一函数标签；基于更新后的第一标签，重复执行生成操作，直至预测得到第一预设函数的全部输入；以及基于第一预设函数以及第一预设函数的全部输入，确定用于解答问题文本的逻辑表达式，以基于逻辑表达式获得问题文本的答案。辑表达式获得问题文本的答案。辑表达式获得问题文本的答案。

全部详细技术资料下载

【技术实现步骤摘要】
逻辑表达式生成方法、模型训练方法、装置及介质

[0001]本公开涉及人工智能
，尤其涉及文本数据处理、深度学习、自然语言处理和问答系统领域，具体涉及一种基于文本数据生成逻辑表达式的方法、模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]随着信息技术的飞速发展，海量的互联网信息不断涌现，无论是数据样式还是数据种类都变得繁多，给互联网用户带来更加丰富多样信息的同时加大了用户信息获取的难度。而问答系统能够基于用户的问题自动检索并输入问题的答案，能够一定程度上降低用户信息获取的难度。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种基于文本数据生成逻辑表达式的方法、模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开...

【技术保护点】

【技术特征摘要】
1.一种基于文本数据生成逻辑表达式的方法，包括：获取问题文本以及与所述问题文本相应的至少一个目标文档；基于所述问题文本、所述至少一个目标文档以及多个函数标签，确定第一文本序列，其中，所述多个函数标签分别与多个用于执行逻辑操作的预设函数相应，所述多个预设函数中的每个预设函数包括至少一个输入，所述至少一个输入中的每个输入具有相应的预设数据格式；对所述第一文本序列进行编码，以获取第一编码向量；对所述第一编码向量和第一标签进行融合编码，以获取第一融合向量，所述第一标签为表达式起始符，所述表达式起始符用于引导所述逻辑表达式中的首个函数标签的生成；基于所述第一融合向量，预测得到第一函数标签，所述第一函数标签对应第一预设函数；将所述第一标签更新为所述第一函数标签；基于更新后的第一标签，重复执行生成操作，直至预测得到所述第一预设函数的全部输入，所述生成操作包括：对所述第一融合向量和所述第一标签进行融合编码，以更新所述第一融合向量；基于更新后的第一融合向量，预测得到所述第一预设函数的具备相应预设数据格式的第一输入；以及将所述第一标签更新为所述第一输入；以及基于所述第一预设函数以及所述第一预设函数的全部输入，确定用于解答所述问题文本的所述逻辑表达式，以基于所述逻辑表达式获得所述问题文本的答案。2.根据权利要求1所述的方法，其中，所述多个预设函数中的每个预设函数还包括至少一个输出，并且所述至少一个输出中的每个输出具有相应的预设数据格式，所述第一预设函数的输入包括第二预设函数的输出，所述方法还包括：基于所述第一融合向量和所述第一函数标签进行融合编码，以获取第二融合向量；基于所述第二融合向量，预测得到第二函数标签，所述第二函数标签对应所述第二预设函数，并且，所述第二预设函数的输出与所述第一预设函数的输入具有相同的数据格式；以及将所述第一标签更新为所述第二函数标签，以基于更新后的第一标签，重复执行所述生成操作，直至预测得到所述第一预设函数的全部输入和所述第二预设函数的全部输入。3.根据权利要求1或2所述的方法，其中，所述多个预设函数用于执行下述逻辑操作中的至少一者：信息抽取、数值计算、数值比较和数据排序。4.根据权利要求1
‑
3中任一项所述的方法，其中，所述获取问题文本以及与所述问题文本相应的至少一个目标文档包括：获取所述问题文本；以及基于所述问题文本，在多个预置文档中确定所述至少一个目标文档。5.根据权利要求4所述的方法，所述多个预置文档中包括由表格转化得到的至少一个第一文档，所述至少一个第一文档的获取包括：获取至少一个表格；以及将所述至少一个表格中每个表格的至少一行表格数据或至少一列表格数据按照预设
格式整理为文档数据，以获取至少一个第一文档。6.一种模型训练方法，包括：获取样本问题、与所述样本问题相应的至少一个样本文档以及与所述样本问题相应的逻辑表达式；基于所述样本问题、所述至少一个样本文档以及多个函数标签，确定第一文本序列，其中，所述多个函数标签分别与多个用于执行逻辑操作的预设函数相应，所述多个预设函数中的每个预设函数包括至少一个输入，所述至少一个输入中的每个输入具有相应的预设数据格式；将所述第一文本序列输入所述模型的第一编码网络，以获取所述第一编码网络输出的第一编码向量；将所述第一编码向量和第一标签输入所述模型的融合编码网络，以获取所述融合编码网络输出的第一融合向量，所述第一标签为表达式起始符，所述表达式起始符用于引导所述逻辑表达式中的首个函数标签的生成；将所述第一融合向量输入所述模型的解码网络，以获得所述解码网络输出的第一函数标签，所述第一函数标签对应第一预设函数；将所述第一标签更新为所述第一函数标签；基于更新后的第一标签，重复执行生成操作，直至预测得到所述第一预设函数的全部输入，所述生成操作包括：将所述第一融合向量和所述第一标签输入所述融合编码网络，以获取所述融合编码网络输出的更新后的第一融合向量；将更新后的第一融合向量输入所述解码网络，以获得所述解码网络输出的所述第一预设函数的具备相应预设数据格式的第一输入；以及将所述第一标签更新为所述第一输入；基于所述第一预设函数以及所述第一预设函数的全部输入，确定表达式预测结果；以及基于所述逻辑表达式和所述表达式预测结果，训练所述模型的所述第一编码网络、所述融合编码网络以及所述解码网络。7.根据权利要求6所述的方法，其中，所述多个预设函数中的每个预设函数还包括至少一个输出，并且所述至少一个输出中的每个输出具有相应的预设数据格式，所述第一预设函数的输入包括第二预设函数的输出，所述方法还包括：将所述第一融合向量和所述第一函数标签输入所述融合编码网络，以获取所述融合编码网络输出的第二融合向量；将所述第二融合向量输入所述解码网络，以获得所述解码网络输出的第二函数标签，所述第二函数标签对应所述第二预设函数，并且，所述第二预设函数的输出与所述第一预设函数的输入具有相同的数据格式；以及将所述第一标签更新为所述第二函数标签，以基于更新后的第一标签，重复执行所述生成操作，直至预测得到所述第一预设函数的全部输入和所述第二预设函数的全部输入。8.根据权利要求6或7所述的方法，其中，所述多个预设函数用于执行下述逻辑操作中的至少一者：信息抽取、数值计算、数值比较和数据排序。
9.一种基于文本数据生成逻辑表达式的装置，包括：第一获取单元，被配置为获取问题文本以及与所述问题文本相应的至少一个目标文档；第一确定单元，被配置为基于所述问题文本、所述至少一个目标文档以及多个函数标签，确定第一文本序列，其中，所述多个函数标签分别与多个用于执行逻辑操作的预设函数相应，所述多个预设函数中的每个预设函数包括至少一个输入，所述至少一个输入中的每个输入具有相应的预设数据格式；第一编码单元，被配置为对所述第一文本序列进行编码，以获取第一编码向量；第二编码单元，被配置为对所述第一编码向量和第一标签进行融合编码，以获取第一融合向量，所述第一标签为表达式起始符，所述表达式起始符用于引导所述逻辑表达式中的首个函数标签的生成；第一预测单元，被配置为基于...

【专利技术属性】
技术研发人员：吴锟，王丽杰，常月，刘璟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人