一种基于1D分组卷积神经网络的数据重构方法技术

技术编号：29615535 阅读：20 留言：0更新日期：2021-08-10 18:31

本发明专利技术公开了一种基于1D分组卷积神经网络的数据重构方法。该方法数据分组、模型的构建与训练优化以及数据重构。计算数据特征之间的相关性并降序排列，然后依据相关性对数据进行分组，输入分组卷积神经网络中进行分组运算，再通过全连接层的全局卷积操作和拼接层的特征拼接，输出重构特征，实现任意维度的特征重构。得到的重构特征维度降低，并且模型的空间复杂度和时间复杂度都有所下降，因此可以减少时间，降低内存资源占用。本方法，在分组时利用了特征之间的相关性，提高了重构特征之间的相关性；通过对数据分组，可以控制重构特征的维度，实现数据降维，不仅简化了深度学习的运算过程，还提高了模型的运算效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于1D分组卷积神经网络的数据重构方法
本专利技术涉及网络安全大数据分析和建模领域，尤其是涉及到一种基于1D分组卷积神经网络的数据重构方法。
技术介绍
网络空间中存在各种各样的网络攻击方式，比如恶意代码、钓鱼邮件和网站、流量攻击、漏洞利用等，这些攻击不仅会造成巨大的经济损失，甚至会威胁国家安全和社会稳定，因此对网络威胁进行检测是很有必要的。在检测的过程中，需要采集大量的网络数据，比如恶意软件、钓鱼邮件、网络流量、系统日志等，构建传统的机器学习模型分析这些数据已经难以取得较好的效果。随着深度学习、人工智能计算的不断发展，以及深度学习技术在计算机视觉、自然语言处理等方面的成功应用，将深度学习技术应用于网络空间威胁检测方面，是一种实现网络安全数据分类，提高网络威胁检测的有效方法。深度学习技术包括多种算法，比如卷积神经网络(CNN)、循环神经网络(RNN)、对抗神经网络(GAN)等，其中，CNN算法利用卷积层的非线性运算，对数据特征进行学习和重新表征，利用池化层的压缩运算，减少数据特征的维度，因此，CNN算法能够用于处理网络安全数据。根据处理数据类型的不同，CNN算法可以构建1D-CNN模型和2D-CNN模型。比如，在处理序列信号数据和自然语言时，构建1D-CNN模型，在处理图像、视频数据时，构建2D-CNN模型。将2D-CNN模型用于网络安全数据进行分类时，首先需要将数据转换为图像格式然后再进行处理，在处理过程中存在运算过程复杂、运算量大的缺陷。
技术实现思路
针对现有技术的不足，本专利技术...

【技术保护点】
1.一种基于1D分组卷积神经网络的数据重构方法，其特征在于：该方法具体包括以下步骤：/n步骤一、构造数据集/n对原始安全数据进行One-hot编码，构建尺寸为N*D的训练集X，其中N为训练集的样本数，D表示训练集维度；Y为训练集X对应的真实类别标签集合；/n步骤二、数据分组/n计算训练集X的D个特征之间的相关性，形成相关性矩阵R，取一组数据R

【技术特征摘要】
1.一种基于1D分组卷积神经网络的数据重构方法，其特征在于：该方法具体包括以下步骤：
步骤一、构造数据集
对原始安全数据进行One-hot编码，构建尺寸为N*D的训练集X，其中N为训练集的样本数，D表示训练集维度；Y为训练集X对应的真实类别标签集合；
步骤二、数据分组
计算训练集X的D个特征之间的相关性，形成相关性矩阵R，取一组数据Rn将其中的D个相关性系数按降序进行排列，根据Rn中排序后的相关性系数将训练集X分为T组，第t组特征数据Xt包含D/T个特征，其中n＝1,2，...N，t＝1,2，...T；
步骤三、构建1D分组CNN算法模型
构建1D分组CNN算法模型，用于对输入的分组数据集进行重构、降维，模型包括1个输入层、L个卷积层、L个池化层、1个全连接层、1个拼接层和1个Softmax层；
所述输入层，用于T组数据的输入；
所述L个卷积层，每个卷积层包含T组卷积运算，每组卷积运算中有M个卷积核，第一个卷积层的输入与输入层的输出相连，经过非线性激活函数ReLU(·)输出后与第一个池化层的输入相连；第l+1个卷积层的输入与第l个池化层的输出相连，输出经过非线性激活函数ReLU(·)后与第l+1个池化层的输入相连，其中l＝1，2...L；在每组卷积运算中，T组数据分别与M个卷积核进行卷积运算，得到卷积特征图；
所述L个池化层，每个池化层包含T组池化运算，每组池化运算中有M个池化核；其中，第L个池化层的输出经过非线性激活函数ReLU(·)后与全连接层的输入相连；池化层采用最大值池化的方式，对卷积层的输出进行最大化下采样，形成池化特征图；
所述全连...

【专利技术属性】
技术研发人员：许艳萍，章霞，裘振亮，叶挺聪，仇建，张桦，吴以凡，张灵均，陈政，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人