一种基于网络的微博消息可信度判别模型的方法技术

技术编号:16662960 阅读:41 留言:0更新日期:2017-11-30 12:00
本发明专利技术是一种基于网络的微博消息可信度判别模型的方法,步骤如下:步骤一:计算先验知识;步骤二:定义网络模式;步骤三:定义元路径并生成网络;步骤四:在异构信息网络上做分类;步骤五:虚假消息识别。本发明专利技术的优点及功效:一、将评论网络建模为异构信息网络并在异构信息网络上做分类,这在微博虚假消息识别中是一次创新。二、训练数据不需要标注,节省了人力和时间。三、相比于以往研究中通过最终结果来计算特征的重要性,本发明专利技术中将特征权重的计算作为模型的一部分,得到最终分类结果的同时也得到了特征的重要性,并且在分类过程中可以观察到特征权重的变化。四、提高了微博虚假消息识别的准确率。

【技术实现步骤摘要】
一种基于网络的微博消息可信度判别模型的方法
本专利技术提供一种基于网络的微博消息可信度判别模型的方法,具体涉及一种将微博消息的评论网络建模为异构信息网络并将消息可信度判别过程映射为异构信息网络上的分类问题的方法,属于数据挖掘

技术介绍
微博(microblog)是一种流行的信息发布和共享社交服务,用户可以通过互联网或移动客户端等传播媒介,随时随地表达个人观点与兴趣爱好。微博凭借信息传播的共享性、实时性、互动性以及传播方式的多样性,深刻地影响了人们的生活方式,极大地提升了网络媒体的服务效能。根据中国互联网信息中心(ChinaInternetNetworkInformationCenter,CINIC)2017年1月发布的全国互联网发展统计报告,我国网民规模达7.31亿,其中微博用户超过2.67亿,占整体网民的36.5%。微博是一种新的自媒体工具,而且其发布信息的门槛较低,任意用户均可通过微博发表个人意见,表达个人情感。微博的此特性使得用户彼此之间的交流更加简单、方便。与此同时,微博独有的信息多样化、表达自由化、传播速度迅速等特性,反而使其成为虚假信息、不实言论传播的绝佳平本文档来自技高网...
一种基于网络的微博消息可信度判别模型的方法

【技术保护点】
一种基于网络的微博消息可信度判别模型的方法,其特征在于:该方法具体步骤如下:步骤一:计算先验知识对于一条评论u,首先计算它在初始状态时是一条虚假评论的可能性yu;在半监督模式中,如果评论u是一条虚假评论,其yu=1,否则yu=0;对于未标注的评论,认为其yu=0;在非监督模式中,评论u在初始状态时是一条虚假评论的可能性yu通过等式(1)计算:

【技术特征摘要】
1.一种基于网络的微博消息可信度判别模型的方法,其特征在于:该方法具体步骤如下:步骤一:计算先验知识对于一条评论u,首先计算它在初始状态时是一条虚假评论的可能性yu;在半监督模式中,如果评论u是一条虚假评论,其yu=1,否则yu=0;对于未标注的评论,认为其yu=0;在非监督模式中,评论u在初始状态时是一条虚假评论的可能性yu通过等式(1)计算:其中,f(xlu)表示评论u关于特征l是一条虚假评论的可能性,L表示总的特征数量;而f(xlu)是通过等式(2)计算:Xl是评论i关于特征l的随机变量,其对应的概率分布为P;步骤二:定义网络模式根据提取的特征可以定义网络模式,网络模式中描述了不同类型的网络节点以及在网络中各个节点是怎样连接的;步骤三:定义元路径并生成网络对于一条评论u,其关于某个特征l的虚假评论确定性的等级由等式(3)计算:其中,s是等级的个数,这里选择s=10,也就是说,一共有10个等级,即如果两条评论u和v,它们关于某个特征l的虚假评论确定性的等级相等,即那么为评论u和评论v之间建立一条关于特征l的元路径,它们之间的元路径的值记为则如果两条评论u和v的虚假评论确定性的等级和不相等,则它们之间就是没有元路径的,它们之间的元路径的值记为对所有评论关于每个特征计算虚假评论确定性的等级,为所有相等等级的两条评论建立元路径,直至生成整个评论网络;步骤四:在异构信息网络上做分类①计算特征权重,得到每个特征在判别模型中的重要性在异构信息网...

【专利技术属性】
技术研发人员:段大高盖新新韩忠明莫倩
申请(专利权)人:北京工商大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1