【技术实现步骤摘要】
一种信息真伪验证方法及系统
本专利技术涉及信息验证
,特别涉及一种信息真伪验证方法及系统。
技术介绍
当前,随着信息时代的迅速发展,人们可以从许多不同的数据源处获取到自己所需的信息,其中,互联网已经逐渐成为当前人们获取数据的主要来源,现在许多数据管理应用都会利用互联网这一数据源来收集数据,由此可为用户提供便捷的数据服务。然而,对于现实世界中同一个实体的同一种属性,不同数据源针对该属性的描述可能是不一样的,在这种情况下,如何对信息的真伪进行有效地辨别便成为了当前亟需解决的问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种信息真伪验证方法及系统,能够实现对信息的真伪进行有效地辨别的目的。其具体方案如下:一种信息真伪验证方法,包括:从不同的数据源中选取出与目标实体的特定属性对应的属性值,得到相应的属性值集合;从所述属性值集合中筛选出具有最多出现频次的属性值,并将该属性值确定为所述特定属性的正确属性值。可选的,所述从不同的数据源中选取出与目标实体的特定属性对应的属性值的过程,包括:利用信息抽取技术,从不同的html网页和/或xml网页中抽取出与所述特定属性对应 ...
【技术保护点】
一种信息真伪验证方法,其特征在于,包括:从不同的数据源中选取出与目标实体的特定属性对应的属性值,得到相应的属性值集合;从所述属性值集合中筛选出具有最多出现频次的属性值,并将该属性值确定为所述特定属性的正确属性值。
【技术特征摘要】
1.一种信息真伪验证方法,其特征在于,包括:从不同的数据源中选取出与目标实体的特定属性对应的属性值,得到相应的属性值集合;从所述属性值集合中筛选出具有最多出现频次的属性值,并将该属性值确定为所述特定属性的正确属性值。2.根据权利要求1所述的信息真伪验证方法,其特征在于,所述从不同的数据源中选取出与目标实体的特定属性对应的属性值的过程,包括:利用信息抽取技术,从不同的html网页和/或xml网页中抽取出与所述特定属性对应的三元组信息,得到与所述特定属性对应的三元组信息集合;其中,所述特定属性对应的三元组信息包括所述目标实体的名称、所述特征属性的名称以及所述特征属性的属性值;将所述三元组信息集合中的所有属性值提取出来,得到所述属性值集合。3.根据权利要求1所述的信息真伪验证方法,其特征在于,所述从不同的数据源中选取出与目标实体的特定属性对应的属性值的过程,包括:利用信息抽取技术,从不同的html网页和/或xml网页中抽取出与所述目标实体对应的三元组信息,得到与所述目标实体对应的三元组信息集合;其中,所述目标实体对应的三元组信息包括所述目标实体的名称、所述目标实体的任一属性的名称以及该属性对应的属性值;从所述三元组信息集合中筛选出与所述特征属性对应的三元组信息,得到目标三元组信息集合;将所述目标三元组信息集合中的所有属性值提取出来,得到所述属性值集合。4.根据权利要求1至3任一项所述的信息真伪验证方法,其特征在于,所述从所述属性值集合中筛选出具有最多出现频次的属性值,并将该属性值确定为所述特定属性的正确属性值的过程,包括:分别对所述属性值集合中相同属性值出现的频次进行统计,得到所述属性值集合中每种属性值对应的出现频次;将出现频次最多的属性值确定为所述特定属性的正确属性值。5.根据权利要求1至3任一项所述的信息真伪验证方法,其特征在于,所述从所述属性值集合中筛选出具有最多出现频次的属性值,并将该属性值确定为所述特定属性的正确属性值的过程,包括:对所述属性值集合进行分组处理,得到多组属性值;其中,每组属性值中的属性值均相同;将所述多组属性值中属性值数量最多的一组属性值确定为目标组;将与所述目标组对应的属性值确定为所述特定属性的正确属性...
【专利技术属性】
技术研发人员:陈伟,李正华,陈文亮,张民,
申请(专利权)人:苏州大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。