信息处理方法、模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：37817523 阅读：6 留言：0更新日期：2023-06-09 09:48

本公开提供了信息处理方法、模型训练方法、装置、设备及存储介质，涉及计算机技术领域，尤其涉及人工智能、自然语言处理等技术领域。具体实现方案为：获取问题描述信息；在知识库中检索问题描述信息相关的知识，得到检索结果；对问题描述信息和检索结果进行内容理解，得到待处理信息；基于待处理信息生成有向无环图，有向无环图中包括至少一个基本推理算子；基于有向无环图处理待处理信息，得到处理结果，并输出有向无环图中各基本推理算子的输入信息和输出结果。本公开实施例可以将推理过程表达和输出出来，能够便于用户了解推理过程，因此提高了认知智能的可解释性，为完善认知智能业务和其他业务提供了数据支持。能业务和其他业务提供了数据支持。能业务和其他业务提供了数据支持。

全部详细技术资料下载

【技术实现步骤摘要】
信息处理方法、模型训练方法、装置、设备及存储介质

[0001]本公开涉及计算机
，尤其涉及人工智能、自然语言处理等

技术介绍

[0002]自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
[0003]自然语言处理技术一个重要的方向是认知智能。其中，问答类和决策类是认知智能中最重要的两类任务。这两类任务在输入输出和计算过程上具有显著共性。例如，输入均为问题相关的描述，输出为问题答案或决策结果。
[0004]目前，不同行业对认知智能业务需求在不断加深，例如，医疗场景中的问答和诊断，金融场景中的咨询和风控，以及工业场景中的故障诊断等等。这些需求广泛存在，具有巨大的应用价值。但由于问题本身的复杂度，需要提高认知智能业务在处理问题过程中的可解释性。然而，当前并没有成熟可用的解决方案。

技术实现思路

[0005]本公开提供了一种信息处理方法、模型训练方法、装置、设备及存储介质。
[0006]根据本公开的一方面，提供了一种信息处理方法，包括：
[0007]获取问题描述信息；
[0008]在知识库中检索问题描述信息相关的知识，得到检索结果；
[0009]对问题描述信息和检索结果进行内容理解，得到待处理信息；
[0010]基于待处理信息生成有向无环图，有向无环图中包括至少一个基本推理算子；
[001...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法，包括：获取问题描述信息；在知识库中检索所述问题描述信息相关的知识，得到检索结果；对所述问题描述信息和所述检索结果进行内容理解，得到待处理信息；基于所述待处理信息生成有向无环图，所述有向无环图中包括至少一个基本推理算子；基于所述有向无环图处理所述待处理信息，得到处理结果，并输出所述有向无环图中各基本推理算子的输入信息和输出结果。2.根据权利要求1所述的方法，其中，候选计算单元集合提供用于生成所述有向无环图的基本推理算子，所述候选计算单元集合中包括以下基本推理算子中的至少一种：匹配判定单元、用于对输入信息和判定条件进行匹配操作并输出匹配结果；因果逻辑单元、用于确定输入信息之间的因果关系；逻辑计算单元、用于执行交叉并补操作；算术计算单元、用于执行加法操作、减法操作、乘法操作和除法操作中的至少一种；比较操作单元、用于比较输入信息和目标信息之间的大小关系；聚合操作单元、用于执行求和操作和计数操作中的至少一种。3.根据权利要求1或2所述的方法，其中，所述基于所述待处理信息生成有向无环图，包括：将所述待处理信息输入到图生成网络，得到有向无环图。4.根据权利要求3所述的方法，其中，所述将所述待处理信息输入到图生成网络，得到有向无环图，包括：将所述待处理信息输入所述图生成网络，得到所述图生成网络输出的有序执行的至少一个基本推理算子；基于所述至少一个基本推理算子的执行顺序，构建所述有向无环图。5.根据权利要求3所述的方法，其中，所述将所述待处理信息输入到图生成网络，得到有向无环图，包括：将所述待处理信息输入所述图生成网络，得到所述有向无环图中的首个基本推理算子；针对所述有向无环图中的每个待生成的基本推理算子，分别执行：将已生成的基本推理算子构建的待完善有向无环图，以及所述待处理信息输入所述图生成网络，得到所述有向无环图中的所述待生成的基本推理算子。6.根据权利要求1
‑
5中任一项所述的方法，其中，所述对所述问题描述信息和所述检索结果进行内容理解，得到待处理信息，包括：将所述问题描述信息和所述检索结果输入神经网络模型进行内容理解；将所述神经网络模型提取的特征表示，确定为所述待处理信息。7.根据权利要求1
‑
6中任一项所述的方法，其中，所述基于所述有向无环图处理所述待处理信息，得到处理结果，包括：基于所述有向无环图处理所述待处理信息，生成与所述问题描述信息匹配的问答类答案；
基于所述问答类答案响应所述问题描述信息。8.根据权利要求1
‑
6中任一项所述的方法，其中，所述基于所述有向无环图处理所述待处理信息，得到处理结果，包括：在所述有向无环图中的基本推理算子为需要执行的决策策略的情况下，执行所述决策策略，得到执行结果；基于所述执行结果响应所述问题描述信息。9.根据权利要求1
‑
8中任一项所述的方法，其中，所述输出所述有向无环图中各基本推理算子的输入信息和输出结果，包括：在所述有向无环图的基础上，标记出各基本推理算子的执行顺序、各基本推理算子的输入信息、以及各基本推理算子的输出结果。10.一种模型训练方法，包括：获取训练样本，所述训练样本中包括问题样本和样本标签；在知识库中检索所述问题样本相关的知识，得到相关知识；对所述问题样本和所述相关知识进行内容理解，得到输入样本；将所述输入样本输入到待训练网络，得到所述待训练网络输出的有向无环图；其中，所述有向无环图中包括至少一个基本推理算子；基于所述待训练网络输出的有向无环图和所述样本标签，确定损失值；基于所述损失值调整所述待训练网络的模型参数，在满足训练收敛条件的情况下，得到用于生成有向无环图的图生成网络。11.根据权利要求10所述的方法，其中，所述将所述输入样本输入到待训练网络，得到所述待训练网络输出的有向无环图，包括：将所述输入样本输入到所述待训练网络，得到所述待训练网络输出的有序执行的至少一个基本推理算子；基于所述多个基本推理算子的执行顺序，构建所述有向无环图。12.根据权利要求10所述的方法，其中，所述将所述输入样本输入到待训练网络，得到所述待训练网络输出的有向无环图，包括：将所述输入样本输入到所述待训练网络，得到所述有向无环图中的首个基本推理算子；针对所述有向无环图中的每个待生成的基本推理算子，分别执行：将已生成的基本推理算子构建的待完善有向无环图，以及待处理信息输入所述待训练网络，得到所述有向无环图中的所述待生成的基本推理算子。13.根据权利要求11或12所述的方法，其中，所述基于所述待训练网络输出的有向无环图和所述样本标签，确定损失值，包括：在所述待训练网络输出的有向无环图与所述样本标签一致的情况下，确定所述损失值为第一值；在所述待训练网络输出的有向无环图与所述样本标签不一致的情况下，确定所述损失值为第二值。14.根据权利要求11或12所述的方法，其中，所述基于所述待训练网络输出的有向无环图和所述样本标签，确定损失值，包括：
将所述待训练网络输出的有向无环图中第n个基本推理算子与所述样本标签中的第n个参考推理算子进行比对，其中n为正整数；在比对结果一致的情况下，确定所述第n个基本推理算子对应第一损失值；在比对结果不一致的情况下，确定所述第n个基本推理算子对应第二损失值；将所述有向无环图中各基本推理算子对应的损失值相加，得到用于调整模型参数的损失值。15.一种信息处理装置，包括：第一获取模块，用于获取问题描述信息；第一检索模块，用于在知识库中检索所述问题描述信息相关的知识，得到检索结果；内容理解模块，用于对所述问题描述信息和所述检索结果进行内容理解，得到待...

【专利技术属性】
技术研发人员：姜文斌，吕雅娟，佘俏俏，吴华，吴甜，王海峰，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人