一种基于文本语义及层次结构的社交网络欺凌检测方法技术

技术编号：32285587 阅读：10 留言：0更新日期：2022-02-12 19:53

本发明专利技术是一种文本语义及层次结构的社交网络欺凌检测方法，识别的对象是社交网络平台中的网络欺凌言论。本方法主要应用于社交网络欺凌检测领域，其核心是利用深度学习算法建立具有层次结构的社交网络欺凌检测模型，从而应用于社交网络平台中的网络欺凌言论检测。该方法的工作流程为读取大量已知标签的社交网络文本数据构成语料库，使用针对性的GloVe文本词嵌入表示方法将文本内容向量化，通过类循环卷积神经网络捕获文本的语义和上下文依赖特征，最后引入层次注意力网络进行社交网络欺凌检测。本方法设计实现了具有强语义学习能力和上下文关系捕获能力的社交网络文本的层次化检测模型，为跨语言、跨平台社交网络欺凌检测提供了新的解决方法。提供了新的解决方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本语义及层次结构的社交网络欺凌检测方法

[0001]本专利技术涉及社交网络欺凌检测领域与自然语言处理领域，主要核心是采集多源社交网络平台的推文数据，利用类类循环卷积神经网络对推文构建特征，并训练层次注意力网络模型，最后使用模型检测社交网络欺凌。

技术介绍

[0002]互联网技术发展至今，早已融入绝大部分人的生活，和人们的日常生活密不可分。社交活动伴随着社交网络在互联网领域的流行，人们越来越喜欢在社交平台上进行交流沟通，与此同时，网络欺凌的泛滥也越专利技术显。作为社交网络普遍存在的问题现象之一，网络欺凌通常是指人们在网络上传播攻击、侮辱性内容，给他人造成极大伤害的行为。很明显，与传统的欺凌相比，网络欺凌的定义多了“在线”的属性。发生于社交网络的欺凌对他人的伤害与传统欺凌相比有过之而无不及。由于互联网技术的便捷性与广泛性、全球庞大的网民数量、高效的交流方式和近似于“24/7/365”的在线服务，网络欺凌会比传统欺凌的发生更不受时间、地点的约束，因此更具伤害性。全球超过一半的社交媒体年轻用户曾遭受过这种长期的可能有组织性的网络欺凌。受害者可能会经历各种各样的情绪，产生诸如尴尬、抑郁、隔绝他人等负面后果，严重的网络欺凌常常会造成受害者精神错乱，影响身心健康。考虑到网络欺凌现象越来越频繁，以及网络欺凌带来的后果之严重，网络欺凌的检测与监管已十分必要。因而，研究或开发自动化的社交网络欺凌检测模型或系统及时遏制网络欺凌行为和净化网络空间环境是亟待解决的问题，且有重要的社会和学术意义。
[0003]当下，社交网络平...

【技术保护点】

【技术特征摘要】
1.一种基于文本语义特征及层次结构的社交网络欺凌检测方法，其特征在于，所述方法包括如下步骤：A、在数据准备模块，采集并收集多个社交网络平台的社交网络文本数据构成语料库，并将其预处理为规定的统一文本格式；B、在文本序列分词分句和词嵌入模块，对社交网络文本进行分词、分句和初始化权重，以便于下一步输入到检测模型；C、在社交网络欺凌检测模块，接收获得的向量化文本序列和初始化单词权重，输入到检测模型中进行社交网络欺凌检测。2.根据权利要求1所述的一种基于文本语义特征及层次结构的社交网络欺凌检测方法，其特征在于：所述的步骤A中采集并收集构建的语料库包含中、英文两种类别语言文本数据；使用数据集包括两个英文Twitter数据集、一个英文维基百科讨论数据集和一个中文新浪微博数据集；语料库存在类别不平衡现象以便检验模型效果。3.根据权利要求1所述的一种...

【专利技术属性】
技术研发人员：许益家，方勇，刘中临，羊少帅，赵志英，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人