虚假网络舆情识别方法技术

技术编号:19009269 阅读:145 留言:0更新日期:2018-09-22 09:07
本发明专利技术公开了一种虚假网络舆情识别方法,用于解决现有的互联网虚假网络舆情识别方法需要处理大量网络信息的技术问题。技术方案是首先采用行为分析技术,对网络论坛信息传播行为进行建模分析,检测出网络热点事件和舆情。然后依据网络水军行为特征,对网络舆情进行多个层面关联性分析,包括空间关联性、时间关联性、主题关联性以及情感关联性等,识别出可能存在的虚假网络舆情。将所处理的网络信息量减少到了最低限度。

False network public opinion recognition method

The invention discloses a false network public opinion identification method, which is used to solve the technical problem that the existing Internet false network public opinion identification method needs to process a large amount of network information. The technical scheme firstly uses behavior analysis technology to model and analyze the information dissemination behavior of the network forum, and detects the network hot events and public opinion. Then, according to the behavior characteristics of the network navy, the network public opinion is analyzed at various levels, including spatial relevance, temporal relevance, theme relevance and emotional relevance, to identify the possible existence of false network public opinion. The amount of network information processed is reduced to a minimum.

【技术实现步骤摘要】
虚假网络舆情识别方法
本专利技术属于互联网舆情分析和识别领域,具体涉及一种虚假网络舆情识别方法。
技术介绍
我国网民已超过5亿人,很多网民将互联网视为了解社情民意、揭露社会弊端、开展社会监督的窗口,很多的社会热点事件都是由网络舆论率先关注、继而引发媒体报道的。互联网已成为新闻舆论监督的重要平台,特别是以多元化、交互式为特点的网络论坛成为网络舆论的主要来源。国内外相关研究主要集中在网络舆情分析技术上,很少涉及虚假网络舆情分析和识别问题。对于网络舆情分析技术,可分为两大类:一是基于内容的舆情分析方法,主要采用网络文本分析技术对网络论坛热点话题进行检测,这种方法需要借助于文字信息处理平台对文本内容进行分析,数据处理量大,处理效率低,不适合于对网络水军所引发的大规模虚假网络舆情的识别和监测;二是基于行为的舆情分析方法,主要采用复杂网络分析方法对网络信息传播行为进行分析,从中寻找网络舆情发生和演化规律,同样这种方法也不适合直接用来对虚假网络舆情的识别和监测。由于虚假网络舆情是互联网中新兴起的不良现象,目前国内外还缺乏系统深入的研究,尚未提出有效的虚假网络舆情识别方法。对于互联网各大网络论坛,存在如下事实:(1)网络论坛中大多数帖子是一般性的,能够引发热点事件而形成网络舆情的帖子只占少数;(2)在发生的网络舆情中,由网络水军引发的虚假网络舆情占50%左右。
技术实现思路
为了克服现有的互联网虚假网络舆情识别方法需要处理大量网络信息的不足,本专利技术提供一种虚假网络舆情识别方法。该方法采用行为分析和内容分析相结合的逐步求精处理方法,首先采用行为分析技术,对网络论坛信息传播行为进行建模分析,检测出网络热点事件和舆情。然后依据网络水军行为特征,对网络舆情进行多个层面关联性分析,包括空间关联性、时间关联性、主题关联性以及情感关联性等,识别出可能存在的虚假网络舆情。可将所处理的网络信息量减少到最低限度。本专利技术解决其技术问题所采用的技术方案是:一种虚假网络舆情识别方法,其特点是包括以下步骤:步骤一、利用网络数据采集工具,从互联网中需要监测的网络论坛上采集网络发帖信息、发帖用户信息、帖子内容、回帖用户信息以及回帖内容,提取其中的元信息,网络信息经过数据清洗等预处理后存入数据库待分析。步骤二、对于每个被监测的网络论坛,按下列方法检测是否存在网络舆情或热点事件。以用户为节点,用户之间的联系为节点之间的连线,建立用户-用户网络模型。通过用户-用户之间的联系形成有向网络,在一个带值的有向网络中,一个节点的威望度是指这个节点的入度与所有节点的入度和的比值,威望度计算公式如下:&lt;math&gt;&lt;mrow&gt;&lt;msub&gt;&lt;mi&gt;P&lt;/mi&gt;&lt;mi&gt;D&lt;/mi&gt;&lt;/msub&gt;&lt;mrow&gt;&lt;mo&gt;(&lt;/mo&gt;&lt;msub&gt;&lt;mi&gt;v&lt;/mi&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;/msub&gt;&lt;mo&gt;)&lt;/mo&gt;&lt;/mrow&gt;&lt;mo&gt;=&lt;/mo&gt;&lt;mfrac&gt;&lt;msub&gt;&lt;mi&gt;x&lt;/mi&gt;&lt;mrow&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;mn&gt;1&lt;/mn&gt;&lt;/mrow&gt;&lt;/msub&gt;&lt;mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn>&lt;/mrow&gt;&lt;mi&gt;I&lt;/mi&gt;&lt;/munderover&gt;&lt;msub&gt;&lt;mi&gt;x&lt;/mi&gt;&lt;mrow&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;mn&gt;1&lt;/mn&gt;&lt;/mrow&gt;&lt;/msub&gt;&lt;/mrow&gt;&lt;/mfrac&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;mrow&gt;&lt;mo&gt;(&lt;/mo&gt;&lt;mn&gt;1&lt;/mn&gt;&lt;mo&gt;)&lt;/mo&gt;&lt;/mrow&gt;&lt;/mrow&gt;&lt;/math&gt;式中,xi-表示节点vi入度。入度是指所有指向该节点的所有连线上数值之和。在一个带值的有向网络中,一个节点的中心度是指这个节点的出度与所有节点的出度和的比值。中心度计算公式如下:&lt;math&gt;&lt;mrow&gt;&lt;msub&gt;&lt;mi&gt;C&lt;/mi&gt;&lt;mi&gt;D&lt;/mi&gt;&lt;/msub&gt;&lt;mrow&gt;&lt;mo&gt;(&lt;/mo&gt;&lt;msub&gt;&lt;mi&gt;v&lt;/mi&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;/msub&a本文档来自技高网...
虚假网络舆情识别方法

【技术保护点】
1.一种虚假网络舆情识别方法,其特征在于包括以下步骤:步骤一、利用网络数据采集工具,从互联网中需要监测的网络论坛上采集网络发帖信息、发帖用户信息、帖子内容、回帖用户信息以及回帖内容,提取其中的元信息,网络信息经过预处理后存入数据库待分析;步骤二、对于每个被监测的网络论坛,按下列方法检测是否存在网络舆情或热点事件;以用户为节点,用户之间的联系为节点之间的连线,建立用户-用户网络模型;通过用户-用户之间的联系形成有向网络,在一个带值的有向网络中,一个节点的威望度是指这个节点的入度与所有节点的入度和的比值,威望度计算公式如下:

【技术特征摘要】
1.一种虚假网络舆情识别方法,其特征在于包括以下步骤:步骤一、利用网络数据采集工具,从互联网中需要监测的网络论坛上采集网络发帖信息、发帖用户信息、帖子内容、回帖用户信息以及回帖内容,提取其中的元信息,网络信息经过预处理后存入数据库待分析;步骤二、对于每个被监测的网络论坛,按下列方法检测是否存在网络舆情或热点事件;以用户为节点,用户之间的联系为节点之间的连线,建立用户-用户网络模型;通过用户-用户之间的联系形成有向网络,在一个带值的有向网络中,一个节点的威望度是指这个节点的入度与所有节点的入度和的比值,威望度计算公式如下:&lt;math&gt;&lt;mrow&gt;&lt;msub&gt;&lt;mi&gt;P&lt;/mi&gt;&lt;mi&gt;D&lt;/mi&gt;&lt;/msub&gt;&lt;mrow&gt;&lt;mo&gt;(&lt;/mo&gt;&lt;msub&gt;&lt;mi&gt;v&lt;/mi&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;/msub&gt;&lt;mo&gt;)&lt;/mo&gt;&lt;/mrow&gt;&lt;mo&gt;=&lt;/mo&gt;&lt;mfrac&gt;&lt;msub&gt;&lt;mi&gt;x&lt;/mi&gt;&lt;mrow&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;/mrow&gt;&lt;/msub&gt;&lt;mrow&gt;&lt;munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow>&lt;mi&gt;n&lt;/mi&gt;&lt;/munderover&gt;&lt;msub&gt;&lt;mi&gt;x&lt;/mi&gt;&lt;mrow&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;/mrow&gt;&lt;/msub&gt;&lt;/mrow&gt;&lt;/mfrac&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;mo&gt;-&lt;/mo&gt;&lt;mrow&gt;&lt;mo&gt;(&lt;/mo&gt;&lt;mn&gt;1&lt;/mn&gt;&lt;mo&gt;)&lt;/mo&gt;&lt;/mrow&gt;&lt;/mrow&gt;&lt;/math&gt;式中,xi-表示节点vi入度;入度是指所有指向该节点的所有连线上数值之和;在一个带值的有向网络中,一个节点的中心度是指这个节点的出度与所有节点的出度和的比值;中心度计算公式如下:&lt;math&gt;&lt;mrow&gt;&lt;msub&gt;&lt;mi&gt;C&lt;/mi&gt;&lt;mi&gt;D&lt;/mi&gt;&lt;/msub&gt;&lt;mrow&gt;&lt;mo&gt;(&lt;/mo&gt;&lt;msub&gt;&lt;mi&gt;v&lt;/mi&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;/msub&gt;&lt;mo&gt;)&lt;/mo&gt;&lt;/mrow&gt;&lt;mo&gt;=&lt;/mo&gt;&lt;mfrac&gt;&lt;msub&gt;&lt;mi&gt;x&lt;/mi&gt;&lt;mrow&gt;&lt;mi&gt;i&lt;/mi&gt;&lt;mo&gt;+&lt;/mo&gt;&lt;/mrow&gt;&lt;/msub&gt;&lt;mrow&gt;&lt;munderov...

【专利技术属性】
技术研发人员:赵乔
申请(专利权)人:苏州华必讯信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1