基于深度卷积网络的有害网址分析方法、装置和介质制造方法及图纸

技术编号:35018177 阅读:15 留言:0更新日期:2022-09-24 22:45
本申请公开了基于深度卷积网络的有害网址分析方法、装置和介质,方法包括:对小样本语音进行预处理;使用预训练好的语音模型对所述小样本语音进行特征提取,得到隐藏层输出的特征向量;对所述特征向量进行深度特征提取,得到深层语义特征;将所述深层语义特征经过所述语音模型的全连接层并分类,进行语音模型的训练和测试。本申请的模型训练基于网址训练,训练所需要的时间和计算资源较少,且面对新的网址检测任务提高了系统的实用价值和处理效率。址检测任务提高了系统的实用价值和处理效率。址检测任务提高了系统的实用价值和处理效率。

【技术实现步骤摘要】
基于深度卷积网络的有害网址分析方法、装置和介质


[0001]本申请涉及网址分析领域,尤其是基于深度卷积网络的有害网址分析方法、装置和介质。

技术介绍

[0002]网址分类和分析对于网络安全具有重要作用。相关的有害网址分类技术多为通过匹配网址,基于大数据和AI、机器学习和深度学习及迁移学习技术分析实现。相关的针对有害网址处理深度学习模型往往需要大量的有标签数据进行训练,而在实际应用中,很难获得针对某一特殊领域或者特殊用户群体的大量的有标签的训练信息,导致利用小样本数据训练出的模型往往无法达到理想的效果。此外,训练出一个成熟的深度机器学习模型需要消耗大量的时间以及计算资源,导致针对于新任务的训练成本大大提高。
[0003]因此,相关技术存在的上述技术问题亟待解决。

技术实现思路

[0004]本申请旨在解决相关技术中的技术问题之一。为此,本申请实施例提供基于深度卷积网络的有害网址分析方法、装置和介质,能够以较高效率对有害网址进行分析。
[0005]根据本申请实施例一方面,提供基于深度卷积网络的有害网址分析方法,所述方法包括:
[0006]对小样本语音进行预处理;
[0007]使用预训练好的语音模型对所述小样本语音进行特征提取,得到隐藏层输出的特征向量;
[0008]对所述特征向量进行深度特征提取,得到深层语义特征;
[0009]将所述深层语义特征经过所述语音模型的全连接层并分类,进行语音模型的训练和测试。
[0010]在其中一个实施例中,所述对小样本语音进行预处理,包括:
[0011]对所述小样本语音进行去噪声处理。
[0012]在其中一个实施例中,所述隐藏层的输出包括每个所述小样本语音对应的语义特征。
[0013]在其中一个实施例中,对所述特征向量进行深度特征提取包括:
[0014]采用LSTM网络对所述特征向量进行深度特征提取。
[0015]在其中一个实施例中,将所述深层语义特征经过全连接层并分类,包括:
[0016]将所述深层语义特征输入Softmax分类器进行分类。
[0017]在其中一个实施例中,所述进行语音模型的训练和测试后,所述方法还包括:
[0018]将分类后的深层语义特征作为输入量输入所述语音模型并进行训练。
[0019]在其中一个实施例中,所述语音模型为深度卷积网络模型,所述深度卷积网络模型包括输入层、隐藏层和输出层。
[0020]根据本申请实施例一方面,提供基于深度卷积网络的有害网址分析装置,所述装置包括:
[0021]预处理模块,用于对小样本语音进行预处理;
[0022]特征提取模块,用于使用预训练好的语音模型对所述小样本语音进行特征提取,得到隐藏层输出的特征向量;
[0023]深度提取模块,用于对所述特征向量进行深度特征提取,得到深层语义特征;
[0024]分类模块,用于将所述深层语义特征经过所述语音模型的全连接层并分类,进行语音模型的训练和测试。
[0025]根据本申请实施例一方面,提供基于深度卷积网络的有害网址分析装置,所述装置包括:
[0026]至少一个处理器;
[0027]至少一个存储器,所述存储器用于存储至少一个程序;
[0028]当至少一个所述程序被至少一个所述处理器执行时实现如前面实施例所述的基于深度卷积网络的有害网址分析方法。
[0029]根据本申请实施例一方面,提供介质,所述介质存储有处理器可执行的程序,所述处理器可执行的程序被处理器执行时实现如前面实施例所述基于深度卷积网络的有害网址分析方法。
[0030]本申请实施例提供的基于深度卷积网络的有害网址分析方法、装置和介质的有益效果为:本申请对小样本语音进行预处理,使用预训练好的语音模型对所述小样本语音进行特征提取,得到隐藏层输出的特征向量;对所述特征向量进行深度特征提取,得到深层语义特征;将所述深层语义特征经过所述语音模型的全连接层并分类,进行语音模型的训练和测试。本申请的模型训练基于网址训练,训练所需要的时间和计算资源较少,且面对新的网址检测任务提高了系统的实用价值和处理效率。
[0031]本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
[0032]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本申请实施例提供的基于深度卷积网络的有害网址分析方法的流程图;
[0034]图2为本申请实施例提供的基于深度卷积网络的有害网址分析方法的示意图;
[0035]图3为本申请实施例提供的基于深度卷积网络的有害网址分析装置的示意图;
[0036]图4为本申请实施例提供的基于深度卷积网络的有害网址分析装置的示意图。
具体实施方式
[0037]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是
本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0038]本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0039]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0040]网址分类和分析对于网络安全具有重要作用。相关的有害网址分类技术多为通过匹配网址,基于大数据和AI、机器学习和深度学习及迁移学习技术分析实现。相关的针对有害网址处理深度学习模型往往需要大量的有标签数据进行训练,而在实际应用中,很难获得针对某一特殊领域或者特殊用户群体的大量的有标签的训练信息,导致利用小样本数据训练出的模型往往无法达到理想的效果。此外,训练出一个成熟的深度机器学习模型需要消耗大量的时间以及计算资源,导致针对于新任务的训练成本大大提高。
[0041]深度学习:深度学习是机器学习的一种,而机器学习是实现人工智能的必本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于深度卷积网络的有害网址分析方法,其特征在于,所述方法包括:对小样本语音进行预处理;使用预训练好的语音模型对所述小样本语音进行特征提取,得到隐藏层输出的特征向量;对所述特征向量进行深度特征提取,得到深层语义特征;将所述深层语义特征经过所述语音模型的全连接层并分类,进行语音模型的训练和测试。2.根据权利要求1所述的基于深度卷积网络的有害网址分析方法,其特征在于,所述对小样本语音进行预处理,包括:对所述小样本语音进行去噪声处理。3.根据权利要求1所述的基于深度卷积网络的有害网址分析方法,其特征在于,所述隐藏层的输出包括每个所述小样本语音对应的语义特征。4.根据权利要求1所述的基于深度卷积网络的有害网址分析方法,其特征在于,对所述特征向量进行深度特征提取包括:采用LSTM网络对所述特征向量进行深度特征提取。5.根据权利要求1所述的基于深度卷积网络的有害网址分析方法,其特征在于,将所述深层语义特征经过全连接层并分类,包括:将所述深层语义特征输入Softmax分类器进行分类。6.根据权利要求1所述的基于深度卷积网络的有害网址分析方法,其特征在于,所述进行语音模型的训练和测试后,所述方法还包括:将分类后的深层语义特征...

【专利技术属性】
技术研发人员:刘立峰王坤王文重张建军
申请(专利权)人:珠海高凌信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1