一种社交媒体中不当玩梗类信息识别方法技术

技术编号:37960083 阅读:20 留言:0更新日期:2023-06-30 09:35
本发明专利技术公开了一种社交媒体不当玩梗类信息的识别方法,属控制算法技术领域。其步骤如下:计算社交媒体文本的内容偏差值d

【技术实现步骤摘要】
一种社交媒体中不当玩梗类信息识别方法


[0001]本专利技术涉及文本分类算法领域,具体地说,涉及一种社交媒体不当玩梗类信息识别方法。

技术介绍

[0002]社交媒体时代,网络成为舆论的重要阵地,而网络舆论的失焦现象也成为了突出问题。舆论失焦是指由于网络发展,公众知情权、话语权提升,事件中的舆论难以被一方主导,使得舆情演变的主体脉络呈现多极化反转,以至于逐渐偏离事件的中心议题。某飞机坠毁事件,舆论焦点从对遇难者的同情逐渐转向对遇难者之一的某某的人身攻击,这是典型的舆论失焦案例。舆论失焦下,有时会出现一些无视事件严肃性、不尊重案件受害者的梗。如某女士失踪案后,网络上出现的“......警告”、“......警告”梗。这种不当玩梗是时代发展下网络舆论失焦的一种新的表现形式。
[0003]在2019年中国出版的期刊《决策与信息》中发表的“突发事件中的舆论失焦现象及其启示”,作者认为认为舆论失焦会分散舆论应对的资源力量,导致预警信息传播效果不佳,形成谣言空间降低公信力。
[0004]关于梗文化的已有研究成果多为通过实例解析梗的词源、传播机本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种社交媒体不当玩梗类信息识别方法,其特征在于,其具体步骤如下:A、计算社交媒体文本的内容偏差特征值d
c
;B、计算社交媒体文本的情感偏差特征值d
s
;C、计算社交媒体文本的用词偏差特征值d
w
;D、基于上述d
c
、d
s
、d
w
三个特征构成社交媒体文本表示向量,使用经典SVM即支持向量机算法识别社交媒体文本是否为不当玩梗类信息。2.根据权利要求1所述的一种社交媒体不当玩梗类信息识别的方法,其特征在于,步骤(A)中所述的计算社交媒体文本的内容偏差值d
c
,其具体步骤包括:A1、对不当玩梗类信息语料库中的社交媒体文本进行预处理,去除社交媒体文本中的链接网址、表情符号,获得预处理社交媒体文本;A2、获取不当玩梗类信息top15高频词,其中,top5的高频词均选为特征词,去除其余高频词中的数词、情态动词、时间名词和时间副词,剩下的也选作特征词,由此构建不当玩梗类信息特征词集;A3、社交媒体文本内容偏差值的计算方法为:其中:n为社交媒体文本中特征词个数;w
i
为第i个特征词...

【专利技术属性】
技术研发人员:仲兆满杜家云管燕
申请(专利权)人:江苏海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1