本申请提供一种结合语义和行为的神经网络的垃圾邮件检测方法及系统,该方法包括:通过递归神经网络对用户的语义信息进行建模,获得语义特征因子;通过图神经网络对用户的行为模式进行建模,获得行为模式特征因子;将语义特征因子和行为模式特征因子串联,构建全局特征空间;利用长短期记忆网络,模拟全局特征空间的演化特征,预测用户界面的性质
【技术实现步骤摘要】
结合语义和行为的神经网络的垃圾邮件检测方法及系统
[0001]本申请涉及数据处理
,尤其涉及一种结合语义和行为的神经网络的垃圾邮件检测方法及系统
。
技术介绍
[0002]垃圾邮件正在成为基于物联网
(IoT)
的社交媒体应用的主要威胁
。
这将对物联网网络空间构成严重的安全威胁
。
物联网领域的垃圾邮件处理主要有两大类
:1)
基于神经网络的方法
;2)
基于元启发式优化算法的方法
。
然而,它们无法有效地处理隐藏的
、
复杂的
、
不断变化的垃圾邮件活动,特别是在高度不确定的物联网环境中
。
为了确保一个安全可靠的环境,有效的垃圾邮件发送者检测或识别机制至关重要
。
[0003]然而,基于物联网的社交媒体的垃圾邮件发送者的精确检测在实践中通常被视为一项具有挑战性的任务,原因有二
。
首先,在线垃圾邮件与社交网络高度相关
。
因此,社会关系甚至财务关系等语境信息需要作为辅助进行深入分析
。
其次,优秀的语义特征建模方案发挥着重要作用
。
这是因为网络垃圾邮件的主要目的是为公众舆论创造具体的方向
。
考虑到物联网应用环境更加复杂,建立更多的细粒度特征空间将极大地影响垃圾邮件发送者检测的效果
。
[0004]近年来,很多的研究致力于垃圾邮件发送者的检测<br/>。
相关研究可分为两类
:1)
基于行为模式的方法
;2)
基于语义模式的方法
。
前者集中于社会行为
、
评论行为和转发行为等主要行为的模式特征
。
后者则从语言统计的角度强调言语内容的语义特征
。
[0005]现有技术方案
1:A. Makkar and N. Kumar,
ꢀ“
An efficient deep learning
‑
based scheme for web spam detection in IoT environment,
”ꢀ
Future Generation Computer Systems, vol. 108, pp. 467
–
487, 2020.
该方法使用了一种在物联网中检测网络垃圾邮件的深度学习模型
。
他们的系统增强了搜索引擎检测网络垃圾信息的认知能力
。
该模型通过搜索引擎计算出的网页排名分数,去除垃圾网页
。
他们的框架首次将
LSTM
模型用于垃圾邮件检测,并被用于天气预报等问题
。
[0006]现有技术方案
2:Ali Hosseinalipour and Reza Ghanbarzadeh. 2022.
ꢀ“
A novel approach for spam detection using horse herd optimization algorithm. Neural Computing and Applications.”该方法提出了一种新的基于马群元启发式优化算法的垃圾邮件检测方法 。
首先,将连续的
HOA
转化为离散算法
;
然后得到算法的输入变成了基于反目标,然后转变为多目标
。
最后,将其用于垃圾邮件检测,即离散化以及多目标问题
。
[0007]现有技术的缺点1:在与监管机制长期对抗的过程中,掩盖滥发讯息活动的工作日趋成熟,难以被识别
。
例如,许多垃圾邮件发送者通常会像普通用户一样进行正常的浏览和说话行为
。
在这种情况下,只涉及少量的垃圾邮件操作
。
[0008]现有技术的缺点2:大多数基于元启发式优化算法的方法都具有很好的分析和理解常规机器语音的能力
。
但是这种方法不适用于复杂多变的内容
。
[0009]因此,目前亟需解决的技术问题是:如何对多源信息进行融合,适用于复杂多变的
内容,提高垃圾邮件发送者识别的准确性
。
技术实现思路
[0010]本申请的目的在于提供一种结合语义和行为的神经网络的垃圾邮件检测方法及系统,对多源信息进行融合,适用于复杂多变的内容,提高垃圾邮件发送者识别的准确性
。
[0011]为达到上述目的,本申请提供一种结合语义和行为的神经网络的垃圾邮件检测方法,该方法包括:通过递归神经网络对用户的语义信息进行建模,获得语义特征因子;通过图神经网络对用户的行为模式进行建模,获得行为模式特征因子;将语义特征因子和行为模式特征因子串联,构建全局特征空间;利用长短期记忆网络,模拟全局特征空间的演化特征,预测用户界面的性质
。
[0012]如上所述的结合语义和行为的神经网络的垃圾邮件检测方法,其中,在每个时间戳上,用户的语义模式和行为模式分别通过双向自动编码模型和图神经网络编码为语义特征因子和行为模式特征因子
。
[0013]如上所述的结合语义和行为的神经网络的垃圾邮件检测方法,其中,通过递归神经网络对用户的语义信息进行建模的方法包括如下子步骤:根据用户的语义模式,通过双向自动编码模型对语义模式编码,获取隐藏状态矢量;根据注意力机制,提取文本内容中的关键词和背景词,并根据关键词和背景词,获得隐藏向量;根据隐藏向量,计算关键词注意权重和背景词注意权重;根据隐藏状态矢量和关键词注意权重,获取关键词增强隐藏状态向量;根据隐藏状态矢量和背景词注意权重,计算背景词增强隐藏状态向量;根据关键词增强隐藏状态向量和背景词增强隐藏状态向量,计算语义特征因子
。
[0014]如上所述的结合语义和行为的神经网络的垃圾邮件检测方法,其中,通过图神经网络对用户的行为模式进行建模的方法包括如下子步骤:根据用户的行为模式,建立行为模式向量;通过图神经网络学习行为模式的图嵌入向量;将行为模式的图嵌入向量转移到图神经网络的卷积层和全连接层,生成编码结果,获得行为模式特征因子
。
[0015]如上所述的结合语义和行为的神经网络的垃圾邮件检测方法,其中,根据用户的语义模式,通过双向自动编码模型对语义模式编码,获取隐藏状态矢量的方法包括:双向自动编码模型利用前向激活操作符和后向激活操作符,提取语义模式的前向隐藏状态和后向隐藏状态;将前向隐藏状态和后向隐藏状态串联成隐藏状态矢量
。
[0016]如上所述的结合语义和行为的神经网络的垃圾邮件检测方法,其中,将行为模式的图嵌入向量转移到图神经网络的卷积层和全连接层,生成编码结果,获得行为模式特征因子的方法包括如下步骤:通过卷积层的卷积运算,将图嵌入向量映射为高阶特征;通过全连接层本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种结合语义和行为的神经网络的垃圾邮件检测方法,其特征在于,该方法包括:通过递归神经网络对用户的语义信息进行建模,获得语义特征因子;通过图神经网络对用户的行为模式进行建模,获得行为模式特征因子;将语义特征因子和行为模式特征因子串联,构建全局特征空间;利用长短期记忆网络,模拟全局特征空间的演化特征,预测用户界面的性质
。2.
根据权利要求1所述的结合语义和行为的神经网络的垃圾邮件检测方法,其特征在于,在每个时间戳上,用户的语义模式和行为模式分别通过双向自动编码模型和图神经网络编码为语义特征因子和行为模式特征因子
。3.
根据权利要求2所述的结合语义和行为的神经网络的垃圾邮件检测方法,其特征在于,通过递归神经网络对用户的语义信息进行建模的方法包括如下子步骤:根据用户的语义模式,通过双向自动编码模型对语义模式编码,获取隐藏状态矢量;根据注意力机制,提取文本内容中的关键词和背景词,并根据关键词和背景词,获得隐藏向量;根据隐藏向量,计算关键词注意权重和背景词注意权重;根据隐藏状态矢量和关键词注意权重,获取关键词增强隐藏状态向量;根据隐藏状态矢量和背景词注意权重,计算背景词增强隐藏状态向量;根据关键词增强隐藏状态向量和背景词增强隐藏状态向量,计算语义特征因子
。4.
根据权利要求2所述的结合语义和行为的神经网络的垃圾邮件检测方法,其特征在于,通过图神经网络对用户的行为模式进行建模的方法包括如下子步骤:根据用户的行为模式,建立行为模式向量;通过图神经网络学习行为模式的图嵌入向量;将行为模式的图嵌入向量转移到图神经网络的卷积层和全连接层,生成编码结果,获得行为模式特征因子
。5.
根据权利要求3所述的结合语义和行为的神经网络的垃圾邮件检测方法,其特征在于,根据用户的语义模式,通过双向自动编码模型对语义模式编码,获取隐藏状态矢量的方法包括:双向自动编码模型利用前向激活操作符和后向激活操作符,提取语义模式的前向隐藏状态和后向隐藏状态;将前向隐藏状态和后向隐藏状态串联成隐藏状态矢量
。6.
根据权利要求4所...
【专利技术属性】
技术研发人员:丁峰,江紫寒,郭智威,余恪平,朱小刚,
申请(专利权)人:南昌大学新一代信息技术产业研究院江西炬能物联技术研究中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。