当前位置: 首页 > 专利查询>重庆大学专利>正文

一种网络欺凌检测方法技术

技术编号:24497988 阅读:32 留言:0更新日期:2020-06-13 03:49
本发明专利技术公开了一种网络欺凌检测方法,包括如下步骤:1)根据社交网络G(U,R)表示用户U

A method of network bullying detection

【技术实现步骤摘要】
一种网络欺凌检测方法
本专利技术涉及网络安全
,尤其是涉及一种网络欺凌检测方法。
技术介绍
现有技术中网络欺凌检测算法一般可以分为两类:基于文本的检测方法和基于多模态的检测方法。基于文本的检测方法只利用文本信息进行检测,是最常见的网络欺凌检测方法。最近许多基于文本的检测方法都采用了词嵌入技术来进行文本表示学习,其主要优点是通过低维的单词表示,大幅提升检测效率。然而,词嵌入技术在处理网络欺凌文本中的“刻意模糊词”时仍旧存在局限性。所谓的“刻意模糊词”指的是在网络欺凌事件中,欺凌信息发布者为逃避系统检测,人为地模糊一些单词。这种刻意制造的欺凌词汇在语料库中非常稀疏。传统的词嵌入技术通常在预处理阶段直接移除稀疏词汇,或者通过随机向量来表示这些稀疏词汇。考虑到这些稀疏的“刻意模糊词”往往在欺凌检测任务中起着至关重要的作用,因此,传统的词嵌入技术并不能很好的作用于网络欺凌检测任务。此外,在某些情况下,检测网络欺凌事件还需要考虑上下文信息,而不是仅仅分析文本本身。例如,若把“你应该穿裙子”发送给女生,则可以看作正常表述;但若将其发送给本文档来自技高网...

【技术保护点】
1.一种网络欺凌检测方法,其特征在于,包括如下步骤:/n1)根据社交网络G(U,R)表示用户U

【技术特征摘要】
1.一种网络欺凌检测方法,其特征在于,包括如下步骤:
1)根据社交网络G(U,R)表示用户Up的社交信息;
2)准确表示Wh中的每一个单词,特别是稀疏词汇;
3)融合步骤1)和步骤2)中得到的社交信息表示和文本信息表示,并且基于此赋予Sh正确的文本标签;
其中,将社交网络表示为G(U,R),节点集合U表示用户集合,边集合R表示用户之间的关注关系集合,将G中所有用户发布的未标记短文本的集合表示为S,令表示标签类别集合,其中k为标签类别个数,S中的每一条文本都能且仅能赋予一个类别标签,令表示用户Up发布的文本Sh∈S中的单词集合,其中l为短文本Sh的长度,S中的每一条短文本都仅属于一名用户。


2.根据权利要求1所述的网络欺凌检测方法,其特征在于:步骤1)中,
根据社交网络G,通过随机游走获得一组节点序列,该序列包含了用户的社交信息,在随机游走过程中,先随机采样一个节点Ui并将其作为根节点,之后随机采样一个Ui的邻居节点Uj,接下来将Uj作为根节点,重复此过程,直到达到预先设定的采样次数阈值;
在完成随机游走过程之后,使用Skip-Gram算法来学习每个用户节点的社交信息表示。


3.根据权利要求1所述的网络欺凌检测方法,其特征在于:步骤2)中,
对于给定的语料库,基于词共现向量相似度的词嵌入方法依次生成:(1)一个共现矩阵其中d是语料库的大小;(2)语料库中的稀疏词汇列表将词频低于预定义阈值b的词看做稀疏词汇;(3)针对每一个稀疏单词的二阶邻域列表其中是稀疏词Oi的二阶邻域列表长度,之后,根据共现矩阵C得到一个相似度矩阵计算公式如公式(1)所示;...

【专利技术属性】
技术研发人员:赵泽华高旻罗逢吉王润生钟将吴映波熊庆宇文俊浩
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1