【技术实现步骤摘要】
一种基于语境表征的中文网络暴力语言检测方法及系统
[0001]本专利技术涉及网络安全领域和自然语言处理的
,尤其涉及一种基于语境表征的中文网络暴力语言检测方法及系统。
技术介绍
[0002]在社交网络环境中,暴力语言的表现形式有很多,比如诅咒、谩骂、诋毁、侮辱等,往往是网民对于热点事件的主观评价。当被大量复制和传播,这些暴力语言的攻击性和破坏力,容易给当事人造成严重的伤害,可能会让受害人遭受抑郁、焦虑等心理创伤。如果网络暴力得不到有效治理,将可能引发大众的不满情绪,甚至会对社会的和谐稳定造成威胁,产生恶劣的社会影响。
[0003]目前关于网络暴力语言的干预仍大量依赖人工介入,存在人力和时间代价的问题。这种基于关键词过滤的传统检测方法具有很大的局限性:
[0004](1)网络环境具有复杂性和多样性,针对于不同社交平台,基于特征工程的网络暴力语言检测方法呈现出不同的结构特征,不具备通用性,且迁移能力较差。
[0005](2)网络暴力语言的表达具有一定的主观性和语境依赖性,有些词语在不同的语境下表现出 ...
【技术保护点】
【技术特征摘要】
1.一种基于语境表征的中文网络暴力语言检测方法,其特征在于:包括,获取并输入当前用户的网络评论数据;构建暴力语言敏感禁止词典,将中文网络语言中的脏话使用情况以及具有明显人身攻击倾向的网络词汇添加到该词典中,提高方法的整体识别效率;构建暴力语言检测模型,对用户的网络评论信息进行分析,检测是否包含网络暴力、情绪化攻击语言敏感词并输出分析结果;其中,所述暴力语言检测模型,通过预训练模型NEZHA对当前用户的网络评论数据进行词嵌入编码,对文本进行上下文建模,作为提取到的文本向量特征表示;将文本向量特征表示输入到BiLSTM层,捕获长距离依赖;采用一个全连接网络进行输出连接;通过softmax函数输出所述暴力语言检测模型的分析结果;根据所述暴力语言检测模型输出的分析结果,判断该网络评论数据是否为网络禁止语言以及是否提示用户修改评论;根据所述用户是否修改评论判断是否跳出检测流程得到检测结果。2.如权利要求1所述的一种基于语境表征的中文网络暴力语言检测方法,其特征在于:对用户的网络评论信息进行判断,检测是否包含网络暴力、情绪化攻击语言敏感词包括,若不包含,则当前用户的网络评论数据默认为非网络暴力语言,正常发布;若包含,则将当前用户的网络评论数据传入网络语言检测模型进行分析。3.如权利要求1所述的一种基于语境表征的中文网络暴力语言检测方法,其特征在于:通过预训练模型NEZHA对当前用户的网络评论数据进行词嵌入编码,对文本进行上下文建模,提取文本向量特征表示包括,采用函数相对位置编码,每个位置转换为它与其他位置的相对距离包括使用正弦编码矩阵和两个可训练的偏差项表示相对位置如下:矩阵和两个可训练的偏差项表示相对位置如下:其中,i,j表示索引位置,a
ij
表示由位置i和位置j的隐藏状态,分别考虑a
ij
的2k维和2k+1维的正弦函数编码,d
z
表示NEZHA模型的每个头的隐藏尺寸大小,即隐藏尺寸除以头的数目。4.如权利要求3所述的一种基于语境表征的中文网络暴力语言检测方法,其特征在于:将文本向量特征表示输入到BiLSTM层,捕获长距离依赖包括,LSTM模型结构中,通过输入门i
t
、遗忘门f
t
和输出门o
t
三个门控机制,控制当前节点的信息输入、状态保持和信息输出,存储当前节点的候选记忆信息,输出门o
t
控制输出信息的获取,计算当前节点的隐藏状态信息h
t
如下:i
t
=σ(W
xi
x
t
+W
hi
h
t
‑1+b
i
)f
t
=σ(W
xf
x
t
+W
hf
h
t
‑1+b
f
)o
t
=σ(W
xo
x
t
+W
ho
h
t
‑1+b
o
)
h
t
=o
t
·
tanh(c
t
)其中,c
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。