一种基于深度学习算法的网络数据资产画像方法技术

技术编号:39326042 阅读:9 留言:0更新日期:2023-11-12 16:04
本发明专利技术涉及网络数据资产领域,公开了一种基于深度学习算法的网络数据资产画像方法,本发明专利技术中,提出了一种基于深度学习算法的网络数据资产画像方法,通过被动流量和网络开源数据的分析提取,构建一个丰富的资产属性库,基于每个属性的功能特点,描述资产的各类属性画像,通过定期的定时任务可对页面的资产画像自动刷新,数据通过镜像采集单向传输到识别系统,无需介入用户环境,基于贝叶斯神经网络算法,自动学习多源数据特征和行为特性。通过该发明专利技术大幅度提高资产分类的准确性,帮助用户获取内外网物联网资产详细信息,方便用户完成资产管理,并使得生成后的资产画像降低滞后性,增强了资产管理的安全防御能力。增强了资产管理的安全防御能力。

【技术实现步骤摘要】
一种基于深度学习算法的网络数据资产画像方法


[0001]本专利技术涉及网络数据资产领域,尤其涉及一种基于深度学习算法的网络数据资产画像方法。

技术介绍

[0002]随着社会的发展,互联网+已经是不可逆转的趋势,各行各业都在以互联网+的形式转变,部署在互联网上的资产也随之增加,现阶段,我国的互联网安全形势日趋严峻复杂,部署在互联网的资产也逐渐成了黑客的重点攻击对象,如何加强对互联网资产的管理,掌握其脉络,已经成为企业的重中之重。
[0003]现有技术中,一般都是通过人工维护资产库、AD域管理、主动扫描和部署终端代理的方式进行网络资产的管理,现有的技术方案存在以下问题:
[0004](1)实时性太差:工人无法实时对资产画像进行刷新,导致资产画像的显示信息滞后
[0005](2)缺乏关联属性:常规探测只能获取孤立资产的属性描述,无法动态监测,同时缺乏关联资产的识别。

技术实现思路

[0006]本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种基于深度学习算法的网络数据资产画像方法。
[0007]为了实现上述目的,本专利技术采用了如下技术方案:一种基于深度学习算法的网络数据资产画像方法,包括以下步骤:
[0008]S1、数据接收:通过资产数据接收模块接收各类资产信息数据以及基础数据;
[0009]S2、数据预处理:通过资产数据预处理模块对经S1中所接收的信息数据进行预处理;
[0010]S3、建模处理:通过模型构建模块对经S2中所接收的数据进行深度的运算并生成对应的数据模型存入对应数据库;
[0011]S4、获取属性:通过获取资产画像属性模块对经S3后持久化的数据进行指定属性的提取;
[0012]S5、画像成型:通过资产画像生成模块调用对应生成图标的API生成具体的资产图像。
[0013]作为上述技术方案的进一步描述:
[0014]在S2中,资产数据预处理模块包括信息数据分类单元,信息数据分类单元对多方式、多来源的数据进行分类处理。
[0015]作为上述技术方案的进一步描述:
[0016]在S2中,资产数据预处理模块还包括信息清洗单元,信息清洗单元首先对数据对资产数据进行格式化,接入数据具有多种方式、多种来源,数据会存在多种格式,针对同一
内容也会存在不同的表达方式,具体包括去重合并、日志类数据的格式范化以及语义统一等。
[0017]作为上述技术方案的进一步描述:
[0018]在S3中,模型构建模块包括深度算法运行单元,所述深度算法运行单元通过贝叶斯神经网络为本平台各业务系统提供数据存储和数据深度挖掘的服务。
[0019]作为上述技术方案的进一步描述:
[0020]贝叶斯神经网络的具体运行流程,包括以下步骤:
[0021]B1:确定网络结构,初始化超参数,根据先验分布对网络参数赋初值;
[0022]B2:用BP算法训练网络,使总误差最小;
[0023]B3:优化超参数;
[0024]B4:对不同的网络参数初始值重复以上三步,发现不同的极小值点;
[0025]B5:对不同的模型重复以上四步,比较它们的显著度。
[0026]作为上述技术方案的进一步描述:
[0027]通过贝叶斯神经网络算法于整个参数空间的概率分布,其预测结果是基于参数后验分布的平均,单一模型对应于参数空间的一个点,从而所有模型对应于整个参数空间。
[0028]作为上述技术方案的进一步描述:
[0029]在S1中,接收的基础数据包括互联网和内网的资产IP、互联网中资产的域名、以及内网资产的主机名;以及收集获取互联网中开源的IP的whois数据、和通过路由协议获取内网资产的资产分组和网络拓扑信息作为基础数据的补充。
[0030]本专利技术具有如下有益效果:
[0031]1、本专利技术中,提出了一种基于深度学习算法的网络数据资产画像方法,通过被动流量和网络开源数据的分析提取,构建一个丰富的资产属性库,基于每个属性的功能特点,描述资产的各类属性画像,通过定期的定时任务可对页面的资产画像自动刷新,数据通过镜像采集单向传输到识别系统,无需介入用户环境,基于贝叶斯神经网络算法,自动学习多源数据特征和行为特性。通过该专利技术大幅度提高资产分类的准确性,帮助用户获取内外网物联网资产详细信息,方便用户完成资产管理,并使得生成后的资产画像降低滞后性,增强了资产管理的安全防御能力。
附图说明
[0032]无。
具体实施方式
[0033]下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]本专利技术提供的一种实施例:一种基于深度学习算法的网络数据资产画像方法,包括以下步骤:
[0035]S1、数据接收:通过资产数据接收模块接收各类资产信息数据以及基础数据;
[0036]S2、数据预处理:通过资产数据预处理模块对经S1中所接收的信息数据进行预处理;
[0037]S3、建模处理:通过模型构建模块对经S2中所接收的数据进行深度的运算并生成对应的数据模型存入对应数据库;
[0038]S4、获取属性:通过获取资产画像属性模块对经S3后持久化的数据进行指定属性的提取;
[0039]S5、画像成型:通过资产画像生成模块调用对应生成图标的API生成具体的资产图像。
[0040]在S2中,资产数据预处理模块包括信息数据分类单元,信息数据分类单元对多方式、多来源的数据进行分类处理,在S2中,资产数据预处理模块还包括信息清洗单元,信息清洗单元首先对数据对资产数据进行格式化,接入数据具有多种方式、多种来源,数据会存在多种格式,针对同一内容也会存在不同的表达方式,具体包括去重合并、日志类数据的格式范化以及语义统一等,在S3中,模型构建模块包括深度算法运行单元,深度算法运行单元通过贝叶斯神经网络为本平台各业务系统提供数据存储和数据深度挖掘的服务,贝叶斯神经网络的具体运行流程,包括以下步骤:
[0041]B1:确定网络结构,初始化超参数,根据先验分布对网络参数赋初值;
[0042]B2:用BP算法训练网络,使总误差最小;
[0043]B3:优化超参数;
[0044]B4:对不同的网络参数初始值重复以上三步,发现不同的极小值点;
[0045]B5:对不同的模型重复以上四步,比较它们的显著度通过贝叶斯神经网络算法于整个参数空间的概率分布,其预测结果是基于参数后验分布的平均,单一模型对应于参数空间的一个点,从而所有模型对应于整个参数空间,在数据接收中,接收的基础数据包括互联网和内网的资产IP、互联网中资产的域名、以及内网资产的主机名;以及收集获取互联网中开源的IP的whois数据、和通过路由协议获取内网资产的资本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习算法的网络数据资产画像方法,其特征在于,包括以下步骤:S1、数据接收:通过资产数据接收模块接收各类资产信息数据以及基础数据;S2、数据预处理:通过资产数据预处理模块对经S1中所接收的信息数据进行预处理;S3、建模处理:通过模型构建模块对经S2中所接收的数据进行深度的运算并生成对应的数据模型存入对应数据库;S4、获取属性:通过获取资产画像属性模块对经S3后持久化的数据进行指定属性的提取;S5、画像成型:通过资产画像生成模块调用对应生成图标的API生成具体的资产图像。2.根据权利要求1所述的一种基于深度学习算法的网络数据资产画像方法,其特征在于:在S2中,资产数据预处理模块包括信息数据分类单元,信息数据分类单元对多方式、多来源的数据进行分类处理。3.根据权利要求1所述的一种基于深度学习算法的网络数据资产画像方法,其特征在于:在S2中,资产数据预处理模块还包括信息清洗单元,信息清洗单元首先对数据对资产数据进行格式化,接入数据具有多种方式、多种来源,数据会存在多种格式,针对同一内容也会存在不同的表达方式,具体包括去重合并、日志类数据的格式范化以及语义统一等。4.根据权利要求1所述的一种基于深度学习算法的网络数据资产画...

【专利技术属性】
技术研发人员:张玉祺程丽鲁星星齐文宇明有为
申请(专利权)人:金祺创北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1