判断陈述真实性的方法和装置、电子设备、可读介质制造方法及图纸

技术编号:22364146 阅读:46 留言:0更新日期:2019-10-23 04:42
本公开实施例提供了一种判断陈述真实性的方法,该方法包括:以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果;根据所述陈述受每个候选检索结果的支持度,以及每个候选检索结果受其它全部候选检索结果的支持度,得到代表所述陈述真实性的置信分。本公开实施例还提供了一种判断陈述真实性的装置、电子设备、计算机可读介质。

【技术实现步骤摘要】
判断陈述真实性的方法和装置、电子设备、可读介质
本公开实施例涉及真实性判断
,特别涉及判断陈述真实性的方法和装置、电子设备、计算机可读介质。
技术介绍
现实中存在很多“陈述”,例如“A大学的现任校长是B先生”,“C会议的召开时间是D日”,“当前的基础贷款利率是E%”等,而这些陈述有可能是真实的,也有可能是不真实(虚假)的。很多情况下,确定陈述是否真实是很重要的。例如,在自动问答系统中,需要确定给出的答案(如通过阅读理解方式从给定文档中得出)当前是否真实;再如,在自动决策领域,做出决策的依据必须是真实的陈述(如要做出是否贷款的决策要依据当前的基础贷款利率)。
技术实现思路
本公开实施例提供一种判断陈述真实性的方法和装置、电子设备、计算机可读介质。第一方面,本公开实施例提供一种判断陈述真实性的方法,其包括:以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果;根据所述陈述受每个候选检索结果的支持度,以及每个候选检索结果受其它全部候选检索结果的支持度,得到代表所述陈述真实性的置信分。在一些实施例中,所述以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果包括:以所述陈述为检索式在智能检索引擎中进行检索,得到多个排序的检索结果,选取排名前预定位的多个检索结果为候选检索结果。在一些实施例中,所述以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果包括:以所述陈述为检索式,分别在多个检索引擎中进行检索,在每个检索引擎的检索结果中,选取至少一个为候选检索结果。在一些实施例中,在所述得到代表所述陈述真实性的置信分后,还包括:判断所述置信分是否超过第一阈值,若是则判定所述陈述真实,若否则判定所述陈述不真实。在一些实施例中,在所述以所述陈述为检索式在检索引擎中进行检索之前,还包括:以所述陈述为检索式在检索引擎中进行初始检索,从所得检索结果中选取多个初始候选检索结果;根据所述陈述受每个初始候选检索结果的支持度,以及每个初始候选检索结果受其它全部初始候选检索结果的支持度,得到代表所述陈述真实性的初始分;在所述得到代表所述陈述真实性的置信分后,还包括:判断所述初始分减去所述置信分所得的差是否超过第二阈值,若是则判定所述陈述不真实,若否则判定所述陈述真实。在一些实施例中,所述根据所述陈述受每个候选检索结果的支持度,以及每个候选检索结果受其它全部候选检索结果的支持度,得到代表所述陈述真实性的置信分包括:得到代表所述陈述的内容特征的陈述向量表示,分别得到代表每个所述候选检索结果的内容特征的多个结果向量表示;根据所述陈述向量表示和结果向量表示,分别得到代表所述陈述受每个候选检索结果的支持度的多个陈述-结果向量表示;根据多个所述陈述-结果向量表示,分别得到代表每个候选检索结果受其它全部候选检索结果的支持度的结果-结果向量表示;根据各所述陈述-结果向量表示以及结果-结果向量表示,得到所述置信分。在一些实施例中,所述根据所述陈述向量表示和结果向量表示,分别得到代表所述陈述受每个候选检索结果的支持度的多个陈述-结果向量表示包括:分别通过双向注意力机制处理所述陈述向量表示与每个结果向量表示,得到多组对应的中间结果向量表示和中间陈述向量表示;分别通过自注意力机制将每组对应的中间结果向量表示和中间陈述向量表示拼接,得到多个所述陈述-结果向量表示;所述根据多个所述陈述-结果向量表示,分别得到代表每个候选检索结果受其它全部候选检索结果的支持度的结果-结果向量表示包括:分别通过注意力机制处理每个陈述-结果向量表示与其它全部陈述-结果向量表示,得到多个所述结果-结果向量表示。第二方面,本公开实施例提供一种判断陈述真实性的装置,其包括:检索模块,用于以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果;置信分模块,用于根据所述陈述受每个候选检索结果的支持度,以及每个候选检索结果受其它全部候选检索结果的支持度,得到代表所述陈述真实性的置信分。在一些实施例中,所述检索模块用于以所述陈述为检索式在智能检索引擎中进行检索,得到多个排序的检索结果,选取排名前预定位的多个检索结果为候选检索结果。在一些实施例中,所述检索模块用于以所述陈述为检索式,分别在多个检索引擎中进行检索,在每个检索引擎的检索结果中,选取至少一个为候选检索结果。在一些实施例中,所述装置还包括:第一判断模块,用于判断所述置信分是否超过第一阈值,若是则判定所述陈述真实,若否则判定所述陈述不真实。在一些实施例中,所述装置还包括:初始分模块,用于以所述陈述为检索式在检索引擎中进行初始检索,从所得检索结果中选取多个初始候选检索结果,以及根据所述陈述受每个初始候选检索结果的支持度,以及每个初始候选检索结果受其它全部初始候选检索结果的支持度,得到代表所述陈述真实性的初始分;第二判断模块,用于判断所述初始分减去所述置信分所得的差是否超过第二阈值,若是则判定所述陈述不真实,若否则判定所述陈述真实。在一些实施例中,所述置信分模块包括:向量化单元,用于得到代表所述陈述的内容特征的陈述向量表示,分别得到代表每个所述候选检索结果的内容特征的多个结果向量表示;陈述-结果单元,用于根据所述陈述向量表示和结果向量表示,分别得到代表所述陈述受每个候选检索结果的支持度的多个陈述-结果向量表示;结果-结果单元,用于根据多个所述陈述-结果向量表示,分别得到代表每个候选检索结果受其它全部候选检索结果的支持度的结果-结果向量表示;置信分单元,用于根据各所述陈述-结果向量表示以及结果-结果向量表示,得到所述置信分。在一些实施例中,所述陈述-结果单元用于分别通过双向注意力机制处理所述陈述向量表示与每个结果向量表示,得到多组对应的中间结果向量表示和中间陈述向量表示,以及分别通过自注意力机制将每组对应的中间结果向量表示和中间陈述向量表示拼接,得到多个所述陈述-结果向量表示;所述结果-结果表示单元用于分别通过注意力机制处理每个陈述-结果向量表示与其它全部陈述-结果向量表示,得到多个所述结果-结果向量表示。第三方面,本公开实施例提供一种电子设备,其包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一种判断陈述真实性的方法。第四方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任意一种判断陈述真实性的方法。本公开实施例中,通过在检索引擎中进行检索得到判断陈述真实性的依据(候选检索结果),由于候选检索结果来自公共网络的大量不同网站,从整体上看具有较强的可靠性和时效性,因此,相对于以特定的权威网站或新闻作为依据判断依据的方式,本公开实施例的方式避免了对个别信息来的依赖,判断的准确度高,通用性高。进一步的,公共网络中的数据是随着时间不断更新的,且其中新出现的数据多数是针对“最新”事实的:例如,当A大学的校长是B先生时,则公共网络中新出现的关于A大学校长的内容,多数与B先生有关;而当A大学的校长变成F先生后,则公共网络中新出现的关于A大学校长的内容,也变成多数与F先生有关,而不会或很少再出现有关B先生的内容本文档来自技高网...

【技术保护点】
1.一种判断陈述真实性的方法,其包括:以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果;根据所述陈述受每个候选检索结果的支持度,以及每个候选检索结果受其它全部候选检索结果的支持度,得到代表所述陈述真实性的置信分。

【技术特征摘要】
1.一种判断陈述真实性的方法,其包括:以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果;根据所述陈述受每个候选检索结果的支持度,以及每个候选检索结果受其它全部候选检索结果的支持度,得到代表所述陈述真实性的置信分。2.根据权利要求1所述的方法,其中,所述以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果包括:以所述陈述为检索式在智能检索引擎中进行检索,得到多个排序的检索结果,选取排名前预定位的多个检索结果为候选检索结果。3.根据权利要求1所述的方法,其中,所述以所述陈述为检索式在检索引擎中进行检索,从所得检索结果中选取多个作为候选检索结果包括:以所述陈述为检索式,分别在多个检索引擎中进行检索,在每个检索引擎的检索结果中,选取至少一个为候选检索结果。4.根据权利要求1所述的方法,其中,在所述得到代表所述陈述真实性的置信分后,还包括:判断所述置信分是否超过第一阈值,若是则判定所述陈述真实,若否则判定所述陈述不真实。5.根据权利要求1所述的方法,其中,在所述以所述陈述为检索式在检索引擎中进行检索之前,还包括:以所述陈述为检索式在检索引擎中进行初始检索,从所得检索结果中选取多个初始候选检索结果;根据所述陈述受每个初始候选检索结果的支持度,以及每个初始候选检索结果受其它全部初始候选检索结果的支持度,得到代表所述陈述真实性的初始分;在所述得到代表所述陈述真实性的置信分后,还包括:判断所述初始分减去所述置信分所得的差是否超过第二阈值,若是则判定所述陈述不真实,若否则判定所述陈述真实。6.根据权利要求1所述的方法,其中,所述根据所述陈述受每个候选检索结果的支持度,以及每个候选检索结果受其它全部候选检索结果的支持度,得到代表所述陈述真实性的置信分包括:得到代表所述陈述的内容特征的陈述向量表示,分别得到代表每个所述候选检索结果的内容特征的多个结果向量表示;根据所述陈述向量表示和结果向量表示,分别得到代表所述陈述受每个候选检索结果的支持度的多个陈述-结果向量表示;根据多个所述陈述-结果向量表示,分别得到代表每个候选检索结果受其它全部候选检索结果的支持度的结果-结果向量表示;根据各所述陈述-结果向量表示以及结果-结果向量表示,得到所述置信分。7.根据权利要求6所述的方法,其中,所述根据所述陈述向量表示和结果向量表示,分别得到代表所述陈述受每个候选检索结果的支持度的多个陈述-结果向量表示包括:分别通过双向注意力机制处理所述陈述向量表示与每个结果向量表示,得到多组对应的中间结果向量表示和中间陈述向量表示;分别通过自注意力机制将每组对应的中间结果向量表示和中间陈述向量表示拼接,得到多个所述陈述-结果向量表示;所述根据多个所述陈述-结果向量表示,分别得到代表每个候选检索结果受其它全部候选检索结果的支持度的结果-结果向量表示包括:分别通过注意力机制处理每个陈述-结果向量表示与其它全部陈述-结果向量表...

【专利技术属性】
技术研发人员:冯欣伟戴松泰余淼周环宇时鸿剑
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1