数据处理方法、装置、电子设备、介质以及程序产品制造方法及图纸

技术编号:38160412 阅读:9 留言:0更新日期:2023-07-13 09:32
本公开提供了一种数据处理方法、装置、电子设备、介质以及程序产品,涉及数据处理技术领域,尤其涉及知识图谱技术,具体为使用大语言模型实现信息的数据处理任务。实现方案为:确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得到分别针对所述多个评估维度的评估信息;基于所述第一信息、所述至少一项第二信息以及所述评估信息确定所述第一信息的验证结果,其中所述验证结果指示所述第一信息的真实性。指示所述第一信息的真实性。指示所述第一信息的真实性。

【技术实现步骤摘要】
数据处理方法、装置、电子设备、介质以及程序产品


[0001]本公开涉及数据处理
,尤其涉及知识图谱技术,具体涉及一种数据处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]事实验证任务是指从大规模的文本语料库中检索出相关的知识作为证据,利用这些证据对声明的真实性进行验证。
[0003]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0004]本公开提供了一种数据处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]根据本公开的一方面,提供了一种数据处理方法,包括:确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得到分别针对所述多个评估维度的评估信息;基于所述第一信息、所述至少一项第二信息以及所述评估信息确定所述第一信息的验证结果,其中所述验证结果指示所述第一信息的真实性。
[0006]根据本公开的另一方面,提供了一种数据处理装置,包括:信息获取单元,被配置成确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;评估单元,被配置成用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得到分别针对所述多个评估维度的评估信息;验证单元,被配置成基于所述第一信息、所述至少一项第二信息以及所述评估信息确定所述第一信息的验证结果,其中所述验证结果指示所述第一信息的真实性。
[0007]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述方法。
[0008]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述方法。
[0009]根据本公开的另一方面,一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现前述方法。
[0010]根据本公开的一个或多个实施例,可以利用经过训练的自然语言生成模型从多个维度对第一信息和第二信息进行评估,从而得到指示第一信息的真实性的验证结果。利用上述方法,可以借助经过训练的自然语言生成模型的通用问题求解能力从不同维度并利用
外部知识对第一信息和第二信息进行评估,并基于评估得到的结果综合给出评估结果。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0013]图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;图2示出了根据本公开的实施例的数据处理方法的示例性流程图;图3示出了根据本公开的实施例的数据处理技术的示例性框图;图4示出了根据本公开的实施例的数据处理装置的示例性框图;图5示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
[0014]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0015]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个要素与另一要素区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0016]在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
[0017]下面将结合附图详细描述本公开的实施例。
[0018]图1示出了根据本公开的实施例可以将本文描述的各种方法和装置在其中实施的示例性系统100的示意图。参考图1,该系统100包括一个或多个客户端设备101、102、103、104、105和106、服务器120以及将一个或多个客户端设备耦接到服务器120的一个或多个通信网络110。客户端设备101、102、103、104、105和106可以被配置为执行一个或多个应用程序。
[0019]在本公开的实施例中,服务器120可以运行使得能够执行根据本公开的实施例的方法的一个或多个服务或软件应用。
[0020]在某些实施例中,服务器120还可以提供其他服务或软件应用,这些服务或软件应用可以包括非虚拟环境和虚拟环境。在某些实施例中,这些服务可以作为基于web的服务或云服务提供,例如在软件即服务(SaaS)模型下提供给客户端设备101、102、103、104、105和/
或106的用户。
[0021]在图1所示的配置中,服务器120可以包括实现由服务器120执行的功能的一个或多个组件。这些组件可以包括可由一个或多个处理器执行的软件组件、硬件组件或其组合。操作客户端设备101、102、103、104、105和/或106的用户可以依次利用一个或多个客户端应用程序来与服务器120进行交互以利用这些组件提供的服务。应当理解,各种不同的系统配置是可能的,其可以与系统100不同。因此,图1是用于实施本文所描述的各种方法的系统的一个示例,并且不旨在进行限制。
[0022]用户可以使用客户端设备101、102、103、104、105和/或106来输入信息并获取针对信息的验证结果。客户端设备可以提供使客户端设备的用户能够与客户端设备进行交互的接口。客户端设备还可以经由该接口向用户输出信息。尽管图1仅描绘了六种客户端设备,但是本领域技术人员将能够理解,本公开可以支持任何数量的客户端设备。
[0023]客户端设备101、102、103、104、105和/或106可以包括各种类型的计算机设备,例如便携式手持设备、通用计算机(诸如个人计算机和膝上型计算机)、工作站计算机、可穿戴设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得到分别针对所述多个评估维度的评估信息;基于所述第一信息、所述至少一项第二信息以及所述评估信息确定所述第一信息的验证结果,其中所述验证结果指示所述第一信息的真实性。2.如权利要求1所述的数据处理方法,其中,所述多个评估维度包括以下各项中的一项或多项:文本语义、文本逻辑、所述第二信息的证明力以及所述第一信息和每个所述第二信息之间的关系。3.如权利要求2所述的数据处理方法,其中,所述文本语义包括针对第一信息和/或第二信息中的至少一个词语的解释。4.如权利要求2所述的数据处理方法,其中,所述文本逻辑包括第一信息和/或第二信息的内部一致性。5.如权利要求2所述的数据处理方法,其中,所述证明力包括所述第二信息的可信度、完整性、准确性、时效性、偏倚度、多文本整合结果中的至少一项。6.如权利要求1

5中任一项所述的数据处理方法,其中,所述针对所述多个评估维度的评估信息包括以下中的至少一项:针对各个评估维度的知识信息;以及针对各个评估维度对所述第一信息的真实性的初步验证信息。7.如权利要求1

5中任一项所述的数据处理方法,其中,基于所述第一信息、所述至少一项第二信息以及所述评估信息确定所述第一信息的验证结果包括:基于所述第一信息、所述至少一项第二信息以及所述评估信息确定用于所述第一信息的待验证信息;基于所述待验证信息确定所述验证结果。8.如权利要求7所述的数据处理方法,其中,基于所述待验证信息确定所述验证结果包括:对所述待验证信息进行分类,以得到所述验证结果。9.如权利要求7所述的数据处理方法,其中,基于所述待验证信息确定所述验证结果包括:将所述待验证信息输入所述自然语言生成模型,以得到所述验证结果。10.如权利要求9所述的数据处理方法,其中,在将所述待验证信息输入所述自然语言生成模型之前,所述方法还包括:确定第一样本信息、与第一样本信息有关的至少一项第二样本信息;基于所述第一样本信息和所述至少一项第二样本信息确定用于所述第一样本信息的针对所述多个评估维度的多个样本评估信息;基于所述样本评估信息用于验证所述第一样本信息的样本推理过程;将所述样本推理过程输入所述自然语言生成模型。11.如权利要求1

5中任一项所述的数据处理方法,其中,所述自然语言生成模型是问
答模型。12.如权利要求1

5中任一项所述的数据处理方法,其中所述第一信息是声明信息,所述至少一项第二信息是证据信息。13.一种数据处理装置,包括:信息获取单元,被配置成确定待验证的第一信息和与所述第一信息有关的至少一项第二信息;评估单元,被配置成用经过训练的自然语言生成模型基于各个评估维度对所述第一信息和所述至少一项第二信息进行处理,以得到分别针对所述多个评估维度的评估信息;验证单元,被配置成基于所述第一信息、所述至少一项...

【专利技术属性】
技术研发人员:吴甜黄金凤姜文斌陆超徐童
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1