基于SOAR模型的网络舆情预测方法技术

技术编号:16885891 阅读:80 留言:0更新日期:2017-12-27 03:41
本发明专利技术公开一种基于SOAR模型的网络舆情预测方法,首先获取典型舆情突发事件的微博数据,然后对数据进行清洗和加工,构建长期记忆规则库,接着获取网民群体工作记忆,将工作记忆与长期记忆规则进行匹配、决策得到每个网民的群体行为,最后统计所有网民的群体行为预测网民的总体情感倾向。本发明专利技术将政府应急管理宏观理论与微观网民行为研究相结合,能够根据不同网络舆情阶段、不同政府应急响应措施预测网民总体情感倾向。

Network public opinion prediction method based on SOAR model

The invention discloses a prediction method of network public opinion based on SOAR model, first get the micro-blog data of typical public opinion, then cleaning and processing of data, build long-term memory rules, then users get a group of working memory, working memory and long-term memory, and decision rules are obtained for each of the users group behavior, group finally, all users of the statistical behavior to predict the overall emotional tendency of Internet users. The invention combines the macro theory of government emergency management with the behavior of microcosmic netizens, and it can predict the general sentiment tendency of netizens according to different network public opinion stages and different government emergency response measures.

【技术实现步骤摘要】
基于SOAR模型的网络舆情预测方法
本专利技术涉及一种网络舆情的预测技术,具体涉及一种基于SOAR模型的突发事件中微博网络舆情的预测方法。
技术介绍
随着Web2.0技术的发展,人们可以自由的在网络上发表自己的言论和看法,网络已经深入介入各种社会事件产生、发展和变化的过程中。微博等新媒体已经成为网络舆情的重要舆论场。网络舆情对于社会公共事件的发展有着重要的影响,网民群体的负面情感是网络舆情的重要特征之一,一个负面信息的发表会导致更多负面信息产生(发表、转发和评论),负面情感将会在整个网络中蔓延,使舆情事件往不利于社会稳定的方向发展。研究有效的网络舆情预测方法以帮助政府决策和维护社会稳定具有重要的意义。Banerjee等人基于物理学粒子交互视角提出Krause-Hegselmann模型,采用简单且固定的交互模式,模拟网络舆情演变过程中的微观现象。但是该方法缺乏与实际管理需求相结合的综合研究,缺乏对网民负面情感行为决策的研究,尤其缺少结合政府应急管理对网民群体行为决策的建模与仿真研究。
技术实现思路
本专利技术的目的在于提供一种基于SOAR模型的网络舆情预测方法,预测不同网络舆情阶段、不同政府应急响应措施下对网民行为的影响。实现本专利技术目的的技术解决方案为:基于SOAR模型的网络舆情预测方法,包括以下步骤:步骤1、采集多个典型网络舆情突发事件的微博数据,存储到数据库中;步骤2、对数据进行清洗和整理,剔除媒体、官微发布的微博数据,得到普通网民发布的微博数据;步骤3、对普通网民发布的微博数据进行加工,包括:对网民进行分类;对网民群体行为进行情感标注,得到微博数据的非负面情感或负面情感;按日统计微博数量,划分网络舆情演变阶段;归纳不同阶段政府采取的应急管理措施;统计政府采取措施前后不同类别网民的总体情感倾向,以及对应的偏好值;步骤4、根据加工数据构建长期记忆规则库:用网络舆情演变阶段、在该阶段政府采取的应急响应措施、网民总体情感倾向表示条件,用网民群体行为表示动作,用条件和动作之间的关联表示规则,用规则相应的偏好值表示规则的偏好,用规则和其相应的偏好分别构建不同类型网民的长期记忆规则库;步骤5、获取网民群体的工作记忆:采集待预测的网络舆情突发事件的微博数据,采用步骤2和步骤3方法进行加工,得到网民种类、对应的网络舆情演变阶段、在该阶段政府采取的应急响应措施、网络舆情演变阶段开始时的网民总体情感倾向构建初始工作记忆;步骤6、根据获取的工作记忆元素与长期记忆规则进行匹配:选择任一网民,其工作记忆元素为当前状态下网民群体工作记忆,每一条规则的条件用来和工作记忆元素匹配,如果匹配成功,则将匹配成功的规则条件加入候选集,否则,采用降低匹配精度的方法生成新规则加入长期记忆规则库再次进行匹配;步骤7、使用偏好知识对候选集的元素进行评估:若候选集元素唯一,则根据长期记忆规则输出对应的行为,否则,根据偏好值对候选元素进行排序,选择偏好值最大的候选元素,根据长期记忆规则输出对应的行为;步骤8、更新网民群体工作记忆:统计当前状态下网民群体负面情感比例,得出新的网民总体情感倾向,以当前状态的网络舆情演变阶段,在该阶段政府采取的应急响应措施和网民总体情感倾向更新网民群体工作记忆;步骤9、预测对应网络舆情演变阶段的网民总体情感倾向:重复步骤6、步骤7和步骤8,计算对应网络舆情演变阶段中每个网民的情感倾向,实时统计对应网络舆情演变阶段的负面情感比例,预测最终的网民总体情感倾向。本专利技术与现有技术相比,其显著优点是:本专利技术将政府应急管理宏观理论与微观网民行为研究相结合,能够根据不同网络舆情阶段、不同政府应急响应措施预测网民总体情感倾向。附图说明图1是SOARAgent模型总体框架图。图2是网络舆情演变过程图。图3是长期记忆形成过程图。图4是网民群体工作记忆示意图。图5是本专利技术的算法流程图。具体实施方式下面结合附图和具体实施例进一步阐述本专利技术方案。基于SOAR模型的网络舆情预测方法,具体步骤如下:步骤1、采集食品安全、公共安全、社会生活3个领域的多个典型网络舆情突发事件的微博数据,存储到数据库中,所述微博数据包括微博原文数据、与其相关的评论数据和转发数据;步骤2、对数据进行清洗和整理,剔除媒体、官微发布的微博数据,得到普通网民发布的微博数据;步骤3、对普通网民发布的微博数据进行加工,包括:(1)对网民进行分类:根据微博原文数据及其相应的评论数据和转发数据中的网民ID,把只发表微博,不转发和评论他人微博的网民划为Me-former类,把既发表微博,也评论或转发他人微博的网民划为In-former类。(2)对网民群体行为进行情感标注,得到微博数据为非负面情感或负面情感;此处的网民群体行为是网民所发微博数据,网民群体行为分为两类:发负面微博和发非负面微博。(3)按日统计微博数量,构建事件发展曲线图,根据曲线拐点划分网络舆情演变阶段,如图2所示,网络舆情演变阶段包括产生、爆发、成熟和衰退四个阶段;(4)归纳不同阶段政府采取的应急管理措施,对政府应急管理措施进行归类,本申请根据Commbs,Yan等人的研究将政府在网络舆情演变的不同阶段采取的应急策略分为:Deny(否认)、Diminish(减弱),Rebuild(修复)、Reinforce(加强),具体细节参照表1;表1.政府应急管理措施归纳(5)统计政府采取措施前后网民总体情感倾向,即统计各阶段各类网民负面情感比例与正面情感比例,负面情感比例大于正面情感比例时,网民总体情感倾向为负面,否则为非负面,对应的比例值为相应的偏好值,偏好值计算公式如下:步骤4、根据加工数据构建长期记忆规则库:用网络舆情演变阶段、在该阶段政府采取的应急响应措施、网民总体情感倾向表示条件,用网民群体行为表示动作,用条件和动作之间的关联表示规则,用相应的偏好值作为规则的偏好,用规则和其相应的偏好分别构建不同类型网民的长期记忆规则库,长期记忆形成过程如图3所示。长期记忆规则库是储存成果的区域,主要负责控制行为。长期记忆知识用if-then形式表示一组条件(即规则的“if”部分)和一组动作(即规则的“then”部分)之间的关联。偏好知识表示网民有多大意愿选择这种动作,它决定了之后匹配得到的候选集中的候选元素的选择。步骤5、获取网民群体的工作记忆:采集待预测的网络舆情突发事件的微博数据,采用步骤2和步骤3方法进行加工,得到网民种类、对应的网络舆情演变阶段、在该阶段政府采取的应急响应措施、网络舆情演变阶段开始时的网民总体情感倾向构建初始工作记忆;在SOAR模型中,工作记忆存储了与当前状态有关的知识,工作记忆由工作记忆元素组成,每个工作记忆元素用三元组表示,此方法中某个状态的工作记忆可以表示如图4。网民群体从外部网络环境中感知信息存储到工作记忆中,包括感知到的网络舆情演变阶段、在该阶段政府采取的应急响应措施和网络环境中网民总体情感倾向,然后在工作记忆中对信息进行编码,与长期记忆规则匹配,选择合适的行为输出。外部影响因素和可能的行为做为工作记忆的输入和输出,如表2所示。表2.工作记忆的输入与输出步骤6、根据获取的工作记忆元素与长期记忆规则进行匹配:选择任一网民,其工作记忆元素为当前网民群体工作记忆,每一条规则的条件用来和工作记忆元素匹配,如果匹本文档来自技高网...
基于SOAR模型的网络舆情预测方法

【技术保护点】
基于SOAR模型的网络舆情预测方法,其特征在于,包括以下步骤:步骤1、采集多个典型网络舆情突发事件的微博数据,存储到数据库中;步骤2、对数据进行清洗和整理,剔除媒体、官微发布的微博数据,得到普通网民发布的微博数据;步骤3、对普通网民发布的微博数据进行加工,包括:对网民进行分类;对网民群体行为进行情感标注,得到微博数据的非负面情感或负面情感;按日统计微博数量,划分网络舆情演变阶段;归纳不同阶段政府采取的应急管理措施;统计政府采取措施前后不同类别网民的总体情感倾向,以及对应的偏好值;步骤4、根据加工数据构建长期记忆规则库:用网络舆情演变阶段、在该阶段政府采取的应急响应措施、网民总体情感倾向表示条件,用网民群体行为表示动作,用条件和动作之间的关联表示规则,用偏好值表示对规则的偏好,用规则和其相应的偏好分别构建不同类型网民的长期记忆规则库;步骤5、获取网民群体的工作记忆:采集待预测的网络舆情突发事件的微博数据,采用步骤2和步骤3方法进行加工,得到网民种类、对应的网络舆情演变阶段、在该阶段政府采取的应急响应措施、网络舆情演变阶段开始时的网民总体情感倾向构建初始工作记忆;步骤6、根据获取的工作记忆元素与长期记忆规则进行匹配:选择任一网民,其工作记忆元素为当前状态下网民群体工作记忆,每一条规则的条件用来和工作记忆元素匹配,如果匹配成功,则将匹配成功的规则条件加入候选集,否则,采用降低匹配精度的方法生成新规则加入长期记忆规则库再次进行匹配;步骤7、使用偏好知识对候选集的元素进行评估:若候选集元素唯一,则根据长期记忆规则输出对应的行为,否则,根据偏好值对候选元素进行排序,选择偏好值最大的候选元素,根据长期记忆规则输出对应的行为;步骤8、更新网民群体工作记忆:统计当前状态下网民群体负面情感比例,得出新的网民总体情感倾向,以当前状态的网络舆情演变阶段,在该阶段政府采取的应急响应措施和网民总体情感倾向更新网民群体工作记忆;步骤9、预测对应网络舆情演变阶段的网民总体情感倾向:重复步骤6、步骤7和步骤8,计算对应网络舆情演变阶段中每个网民的情感倾向,实时统计对应网络舆情演变阶段的负面情感比例,预测最终的网民总体情感倾向。...

【技术特征摘要】
1.基于SOAR模型的网络舆情预测方法,其特征在于,包括以下步骤:步骤1、采集多个典型网络舆情突发事件的微博数据,存储到数据库中;步骤2、对数据进行清洗和整理,剔除媒体、官微发布的微博数据,得到普通网民发布的微博数据;步骤3、对普通网民发布的微博数据进行加工,包括:对网民进行分类;对网民群体行为进行情感标注,得到微博数据的非负面情感或负面情感;按日统计微博数量,划分网络舆情演变阶段;归纳不同阶段政府采取的应急管理措施;统计政府采取措施前后不同类别网民的总体情感倾向,以及对应的偏好值;步骤4、根据加工数据构建长期记忆规则库:用网络舆情演变阶段、在该阶段政府采取的应急响应措施、网民总体情感倾向表示条件,用网民群体行为表示动作,用条件和动作之间的关联表示规则,用偏好值表示对规则的偏好,用规则和其相应的偏好分别构建不同类型网民的长期记忆规则库;步骤5、获取网民群体的工作记忆:采集待预测的网络舆情突发事件的微博数据,采用步骤2和步骤3方法进行加工,得到网民种类、对应的网络舆情演变阶段、在该阶段政府采取的应急响应措施、网络舆情演变阶段开始时的网民总体情感倾向构建初始工作记忆;步骤6、根据获取的工作记忆元素与长期记忆规则进行匹配:选择任一网民,其工作记忆元素为当前状态下网民群体工作记忆,每一条规则的条件用来和工作记忆元素匹配,如果匹配成功,则将匹配成功的规则条件加入候选集,否则,采用降低匹配精度的方法生成新规则加入长期记忆规则库再次进行匹配;步骤7、使用偏好知识对候选集的元素进行评估:若候选集元素唯一,则根据长期记忆规则输出对应的行为,否则,根据偏好值对候选元素进行排序,选择偏好值最...

【专利技术属性】
技术研发人员:方天时王阳春吴鹏王夏婷
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1