一种基于微博信息源的新闻认证方法及系统技术方案

技术编号:11371583 阅读:98 留言:0更新日期:2015-04-30 04:58
本发明专利技术涉及微博新闻可信度领域,特别涉及一种基于微博信息源的新闻认证方法及系统,该方法包括:提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并根据以上三个比例,获取所述用户的社交关系可信度值;获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;获取微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;将以上三个可信度值进行线性加权求和作为综合可信度值。

【技术实现步骤摘要】
一种基于微博信息源的新闻认证方法及系统
本专利技术涉及微博新闻可信度领域,特别涉及一种基于微博信息源的新闻认证方法及系统。
技术介绍
随着微博在人们生活中的普遍应用,使用微博平台获取和发布信息成为人们生活中很重要的部分,微博上信息的真实性问题,也越来越得到人们的重视,微博平台中虚假信息和不实信息的传播,不仅会给网络环境带来负面影响,也会给个人生活和社会稳定带来严重危害,现有技术中对新闻事件的认证还是借助人力的干预判断和调查取证,其缺点是耗费人力多,花费时间长。专利技术专利“一种基于用户行为的用户可信度认证系统及方法”,该专利技术公开了一种基于用户行为的用户可信度认证系统及方法,该系统包括用户身份及行为模式确认模块、用户行为采集模块、用户行为挖掘模块、用户行为序列匹配及可信度认证模块和本地安全策略模块,通过用户行为挖掘模块对用户的行为日志进行行为挖掘,建立用户个性化行为特征序列,通过用户行为序列匹配及可信度认证模块对用户个性化行为特征序列与待匹配序列进行序列相似度计算,获得用户可信度级别,并启用相应的安全策略。该专利技术,利用序列模式挖掘方式,采集用户的实时行为建立待匹配序列,进行行为序列的相似度匹配,以此对用户的实时行为进行可信认证,提高认证的准确率,保障企业和个人财产安全。但是该专利技术仅仅利用用户的行为信息,而本专利技术综合使用了用户的社交关系信息、社交行为信息和社交评价信息;该专利技术从用户行为日志挖掘行为特征序列,而本专利技术以事件关键词为检索关键词搜集数据;该专利技术基于单用户应用平台,不涉及多用户交互,而本专利技术基于的是社交网络。专利技术专利“一种基于微博平台的用户可信度评估方法”,该专利技术基于全球著名的微博平台,如Twitter,新浪微博,腾讯微博等,针对信息可信度进行研究,提出采用用户可信度评估模型来评估用户的可信度,为全球的微博用户识别微博平台上海量信息的真伪提供了关键性的理论依据以供同行参考,并提出了重要的应用价值供广大微博用户运用。该方法可广泛应用于微博平台上的信息可信度评估方面,主要包括微博平台上的用户可信度,主题专家的探测,广告投放效果的实际价值等等,在一定程度上为微博用户在信息化时代准确的识别微博上海量信息的真伪奠定了重要的基础。但该专利技术仅仅利用用户社交关系信息,而本专利技术综合使用了用户的社交关系信息、社交行为信息和社交评价信息;该专利技术主要提出一种简单可泛用的用户可信度的评价模型,而本专利技术则是针对新闻事件认证这一具体任务,用户可信度评估是实现该任务的一个手段。专利技术专利“一种获取社交网络用户可信度方法及系统”,该专利技术获取社交网络用户可信度的方法及系统,其中,所述方法包括:收集社交网络用户在现实世界中与其他用户之间产生的第一社交行为;累积所述第一社交行为的相关数据;根据累积后的第一社交行为的相关数据,获取所述社交网络用户的可信度信息。通过该专利技术,能够获取到更具有参考价值的可信度信息,供用户引用或者查询。但该专利技术需要收集现实世界中的社交行为,数据获取难度大,而本专利技术的分析数据则完全来源于微博平台,数据获取难度小;该专利技术针对社交网络的用户可信度,而本专利技术则是针对新闻事件认证这一具体任务,用户可信度评估只是实现该任务的一个手段。
技术实现思路
针对现有技术的不足,本专利技术提出一种基于信息源的新闻认证方法及系统。本专利技术提出一种基于微博信息源的新闻认证方法,包括:步骤1,提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;步骤2,根据所述用户信息,获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并将所述互粉比例、所述认证粉丝比例、所述粉丝数与关注数比例,通过经验值归一化后加权融合,获取所述用户的社交关系可信度值;步骤3,根据所述用户信息,获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;步骤4,查找所述用户的所有微博,获取所述微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;步骤5,将所述社交关系可信度值、所述社交行为可信度值、所述社交评价可信度值进行线性加权求和作为综合可信度值,根据所述综合可信度值,获取所述新闻的可信度预警等级,以完成认证所述新闻。所述的基于微博信息源的新闻认证方法,将所述用户的粉丝数与关注数分别取log平滑后的比值,作为所述粉丝数与关注数比例。所述的基于微博信息源的新闻认证方法,所述用户活跃度通过以下公式获取:Ac(i)=Count_N(i)/N其中N为天数,i为所述用户,Count_N(i)为所述用户在N天内发表微博的总数,Ac(i)为所述用户活跃度。所述的基于微博信息源的新闻认证方法,所述历史微博平均影响力通过以下公式获取:其中k为所述用户发布的微博k,Re(t)为所述微博k第t个转发引起的二次转发数,T为所述微博K的转发总数,Fluence(k)为历史微博影响力;其中m为所述用户的历史微博数,i为所述用户,avg_Fluence(i)为所述历史微博平均影响力。所述的基于微博信息源的新闻认证方法,所述步骤5还包括:生成预测模型,通过所述预测模型对新闻进行认证。本专利技术还提出一种基于微博信息源的新闻认证系统,包括:获取待认证信息源模块,用于提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;获取社交关系可信度值模块,用于根据所述用户信息,获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并将所述互粉比例、所述认证粉丝比例、所述粉丝数与关注数比例,通过经验值归一化后加权融合,获取所述用户的社交关系可信度值;社交行为可信度值模块,用于根据所述用户信息,获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;社交评价可信度值模块,用于查找所述用户的所有微博,获取所述微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;认证模块,用于将所述社交关系可信度值、所述社交行为可信度值、所述社交评价可信度值进行线性加权求和作为综合可信度值,根据所述综合可信度值,获取所述新闻的可信度预警等级,以完成认证所述新闻。所述的基于微博信息源的新闻认证系统,将所述用户的粉丝数与关注数分别取log平滑后的比值,作为所述粉丝数与关注数比例。所述的基于微博信息源的新闻认证系统,所述用户活跃度通过以下公式获取:Ac(i)=Count_N(i)/N其中N为天数,i为所述用户,Count_N(i)为所述用户在N天内发表微博的总数,Ac(i)为所述用户活跃度。所述的基于微博信息源的新闻认证系统,所述历史微博平均影响力通过以下公式获取:其中k为所述用户发布的微博k,Re(t)为所述微博k第t个转发引起的二次转发数,T为所述微博K的转发总数,Fluence(k)为历史微博影响力;其中m为所述用户的历史微博数,i为所述用户,avg_Fluence(i)为所述历史微博平均影响力。所述的基于微博信息源的新闻认证系统,所述认证模块还包括:生成预测模型,通过所述预测模型对新本文档来自技高网
...
一种基于微博信息源的新闻认证方法及系统

【技术保护点】
一种基于微博信息源的新闻认证方法,其特征在于,包括:步骤1,提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;步骤2,根据所述用户信息,获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并将所述互粉比例、所述认证粉丝比例、所述粉丝数与关注数比例,通过经验值归一化后加权融合,获取所述用户的社交关系可信度值;步骤3,根据所述用户信息,获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;步骤4,查找所述用户的所有微博,获取所述微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;步骤5,将所述社交关系可信度值、所述社交行为可信度值、所述社交评价可信度值进行线性加权求和作为综合可信度值,根据所述综合可信度值,获取所述新闻的可信度预警等级,以完成认证所述新闻。

【技术特征摘要】
1.一种基于微博信息源的新闻认证方法,其特征在于,包括:步骤1,提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;步骤2,根据所述用户信息,获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并将所述互粉比例、所述认证粉丝比例、所述粉丝数与关注数比例,通过经验值归一化后加权融合,获取所述用户的社交关系可信度值;步骤3,根据所述用户信息,获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;步骤4,查找所述用户的所有微博,获取所述微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;步骤5,将所述社交关系可信度值、所述社交行为可信度值、所述社交评价可信度值进行线性加权求和作为综合可信度值,根据所述综合可信度值,获取所述新闻的可信度预警等级,以完成认证所述新闻;其中所述历史微博平均影响力通过以下公式获取:其中k为所述用户发布的微博k,Re(t)为所述微博k第t个转发引起的二次转发数,T为所述微博K的转发总数,Fluence(k)为历史微博影响力;其中m为所述用户的历史微博数,i为所述用户,avg_Fluence(i)为所述历史微博平均影响力。2.如权利要求1所述的基于微博信息源的新闻认证方法,其特征在于,将所述用户的粉丝数与关注数分别取log平滑后的比值,作为所述粉丝数与关注数比例。3.如权利要求1所述的基于微博信息源的新闻认证方法,其特征在于,所述用户活跃度通过以下公式获取:Ac(i)=Count_N(i)/N其中N为天数,i为所述用户,Count_N(i)为所述用户在N天内发表微博的总数,Ac(i)为所述用户活跃度。4.如权利要求1所述的基于微博信息源的新闻认证方法,其特征在于,所述步骤5还包括:生成预测模型,通过所述预测模型对新闻进行认证。5.一种基于微博信息源的新闻认证系统,其特...

【专利技术属性】
技术研发人员:曹娟张俊强谢菲张勇东苏宇李锦涛吕锐陈明祥
申请(专利权)人:中国科学院计算技术研究所新华通讯社
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1