【技术实现步骤摘要】
一种基于主题演化的舆情事件发展预测方法
[0001]本专利技术涉及自然语言处理舆情预测领域,具体为一种基于主题演化的舆情事件发展预测方法。
技术介绍
[0002]随着移动互联网技术和新兴社交媒体的发展,网民以微博、抖音、快手、微信等新兴社交平台为载体,通过视频、文本等方式进行互动发表对社会突发事件的观点、看法和态度,这些民意取向被称为网络舆情。由于这些社交平台在发布方式上具有简单快捷的特点,所以当发生社会突发事件后,网民往往未经过深思熟虑,便会在网上发表自己的见解,通过转发、评论等方式促使了舆情在社交平台上的迅速扩散,从而形成网络舆论,舆情事件主题的生成并不是偶然的,而是对应于现实事件或现象,或者说现实社会生活是热点主题诞生的社会背景,而这些主题切实关乎社会大众的切身利益。网络本身具有开放性与共享性,网民可自由选择是否参与或发表热点主题讨论,而不用确保言论的真实性,因此容易产生过激或不当言论,从而促使网络舆情主题偏离原来面貌,产生不良后果,网络舆情事件的主题演化模式主要包括六个阶段,包括潜伏期、爆发期、蔓延期、反复期、缓解期、长尾期。其中潜伏期主要为主题的产生,爆发期主要表现为受到主流媒体的关注呈现出主题关注度的增加,蔓延期表现为主题关注度持续增加,反复期表现为关注度再次增多,缓解期表现为主题关注度不断减少,长尾期表现为关注度降低到最低值,并在长时间内不再反复。
[0003]为了确保降低某些负面或不正当的网络舆情主题的负面影响,强化网络舆情事件主题预警的及时性和准确性,才能够引导网络舆情主题的演变方向,通过构 ...
【技术保护点】
【技术特征摘要】
1.一种基于主题演化的舆情事件发展预测方法,其特征在于:包括以下具体步骤:步骤1,进行舆情事件的数据采集,并以15分钟为时间单位划分舆情事件初始发展阶段P
′
,并提取每个初始发展阶段的关键词;步骤2,划分舆情事件主题演化阶段,根据相邻初始发展阶段的关键词的持续性与热度重构发展阶段P
″
,并更新关键词集合,将新的发展阶段下的关键词进行聚类形成主题集合;步骤3,提取阶段属性与主题属性,并根据主题的共现关系构建主题关系图;步骤4,构建特征提取模型,提取阶段特征与主题依赖特征;步骤5,构建时序模型,进行舆情事件主题预测,以阶段特征与主题依赖特征作为输入,预测下一阶段的主题。2.根据权利要求1所述的基于主题演化的舆情事件发展预测方法,其特征在于:所述步骤1中舆情事件为网络突发事件,以15分钟为时间单位划分舆情事件数据的初始发展阶段P
′
={p
′1,p
′2,...,p
′
n
},n为阶段数量,此时间单位为经验值。3.根据权利要求1所述的基于主题演化的舆情事件发展预测方法,其特征在于:所述步骤2包括:步骤21,使用关键词提取技术提取每个初始发展阶段P
′
下文本的关键词,得到初始发展阶段的关键词集合Keywords
′
={keywords
′1,keywords
′2,...,keywords
′
i
,...,keywords
′
n
},n为阶段数,也为初始阶段下关键词集合数量,keywords
′
i
∈Keywords
′
为第i个初始发展阶段的关键词集合,kw为关键词,为第i个发展阶段下关键词数重;步骤22,比较相邻的初始发展阶段p
′
i
∈P
′
和p
′
i+1
∈P
′
的关键词的持续性与热度,若相邻初始发展阶段具有相似性,则将两个初始阶段进行合并,重构新的发展阶段P
″
={p
″1,p
″2,...,p
″
m
},m为重构发展阶段后阶段数量,并更新关键词集合Keywords
″
={...
【专利技术属性】
技术研发人员:张学勤,王茜,王先俊,孔明明,刘书伶,田显俊,汪小林,章超,
申请(专利权)人:四川警察学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。