【技术实现步骤摘要】
数据处理方法、装置、电子设备、介质以及程序产品
[0001]本公开涉及数据处理
,尤其涉及知识图谱技术,具体涉及一种数据处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]事实验证任务是指从大规模的文本语料库中检索出相关的知识作为证据,利用这些证据对声明的真实性进行验证。
[0003]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
技术实现思路
[0004]本公开提供了一种数据处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]根据本公开的一方面,提供了一种数据处理方法,包括:确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得到分别针对所述多个评估维度的评估信息;基于所述第一信息、所述至少一项第二信息以及所述评估信息确定所述第一信息的验证结果,其中所述验证结果指示所述第一信息的真实性。
[0006]根据本公开的另一方面,提供了一种数据处理装置,包括:信息获取单元,被配置成确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;评估单元,被配置成用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得到分别针对所述多个评估维度的评估信息;基于所述第一信息、所述至少一项第二信息以及所述评估信息确定所述第一信息的验证结果,其中所述验证结果指示所述第一信息的真实性。2.如权利要求1所述的数据处理方法,其中,所述多个评估维度包括以下各项中的一项或多项:文本语义、文本逻辑、所述第二信息的证明力以及所述第一信息和每个所述第二信息之间的关系。3.如权利要求2所述的数据处理方法,其中,所述文本语义包括针对第一信息和/或第二信息中的至少一个词语的解释。4.如权利要求2所述的数据处理方法,其中,所述文本逻辑包括第一信息和/或第二信息的内部一致性。5.如权利要求2所述的数据处理方法,其中,所述证明力包括所述第二信息的可信度、完整性、准确性、时效性、偏倚度、多文本整合结果中的至少一项。6.如权利要求1
‑
5中任一项所述的数据处理方法,其中,所述针对所述多个评估维度的评估信息包括以下中的至少一项:针对各个评估维度的知识信息;以及针对各个评估维度对所述第一信息的真实性的初步验证信息。7.如权利要求1
‑
5中任一项所述的数据处理方法,其中,基于所述第一信息、所述至少一项第二信息以及所述评估信息确定所述第一信息的验证结果包括:基于所述第一信息、所述至少一项第二信息以及所述评估信息确定用于所述第一信息的待验证信息;基于所述待验证信息确定所述验证结果。8.如权利要求7所述的数据处理方法,其中,基于所述待验证信息确定所述验证结果包括:对所述待验证信息进行分类,以得到所述验证结果。9.如权利要求7所述的数据处理方法,其中,基于所述待验证信息确定所述验证结果包括:将所述待验证信息输入所述自然语言生成模型,以得到所述验证结果。10.如权利要求9所述的数据处理方法,其中,在将所述待验证信息输入所述自然语言生成模型之前,所述方法还包括:确定第一样本信息、与第一样本信息有关的至少一项第二样本信息;基于所述第一样本信息和所述至少一项第二样本信息确定用于所述第一样本信息的针对所述多个评估维度的多个样本评估信息;基于所述样本评估信息用于验证所述第一样本信息的样本推理过程;将所述样本推理过程输入所述自然语言生成模型。11.如权利要求1
‑
5中任一项所述的数据处理方法,其中,所述自然语言生成模型是问
答模型。12.如权利要求1
‑
5中任一项所述的数据处理方法,其中所述第一信息是声明信息,所述至少一项第二信息是证据信息。13.一种数据处理装置,包括:信息获取单元,被配置成确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;评估单元,被配置成用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得到分别针对所述多个评估维度的评估信息;验证单元,被配置成基于所述第一信息、所述至少一项...
【专利技术属性】
技术研发人员:吴甜,黄金凤,姜文斌,陆超,徐童,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。