【技术实现步骤摘要】
电力安全知识数据的采集方法、装置及计算机设备
[0001]本申请涉及网络信息
,特别是涉及一种电力安全知识数据的采集方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]随着智能电网及全球能源互联网的发展,电网工业控制系统由以往的相对封闭转向开放,电网工业控制系统与外部系统交互的边界不断增加,电网工业控制系统逐渐面临来自外部系统和网络空间的安全威胁,因此需要相应的安全威胁及漏洞解决的安全知识。
[0003]安全知识数据来源于漏洞库、开源工具建立的开源论坛、安全厂商组织的安全社区、以及安全爱好者或研究人员自发组织的安全社区,以及众多分散于各处的安全爱好者自有知识等。当人们想要收集这些安全知识数据时,必须手动访问对应的网站,收集效率低下,不便于对数据信息的收集与整合。
[0004]因此,需要一种方法实现不同数据源的高效自动化采集数据,从而完成对多数据源的安全知识数据的收集与整合。
技术实现思路
[0005]基于此,有必要针对上述技术问题,提供一种能够高效自动采集电力行业的 ...
【技术保护点】
【技术特征摘要】
1.一种电力安全知识数据的采集方法,其特征在于,所述方法包括:获取当前待采集的数据源标识;确定与所述数据源标识对应的数据源类型,并根据所述数据源类型,确定对应的数据采集方式;基于所述数据采集方式,提取与所述数据源标识相关联的数据源中的电力安全知识数据;利用漏洞库对所述电力安全知识数据进行规范化处理,得到具有规范格式的候选电力安全知识数据;对所述候选电力安全知识数据进行验证,以获得经验证通过得到的目标电力安全知识数据,并将所述目标电力安全知识数据存储至存储对象中;其中,所述存储对象至少包括数据库和二进制文件中的一种。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在当前待采集的数据源标识完成数据采集后,根据采集策略确定下一个待采集的数据源标识;其中,所述采集策略至少包括深度优先采集策略、广度优先采集策略、以及最佳优先采集策略中的一种;将所述下一个待采集的数据源标识作为当前待采集的数据源标识,并返回至确定与所述数据源标识对应的数据源类型的步骤继续执行,直至待采集队列中的所有数据源标识均完成数据采集。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:从所述待采集队列中删除已采集的数据源标识,并将已采集的数据源标识放入至已采集队列中。4.根据权利要求3所述的方法,其特征在于,所述数据源关联有多个数据源标识;所述方法还包括:确定与所述数据源对应的全部数据源标识中,除当前待采集的数据源标识以外的其他数据源标识;若所述其他数据源标识存在于已采集队列中,则丢弃所述其他数据源标识;若所述其他数据源标识不存在于已采集队列中,则将所述其他数据源标识放入待采集队列中。5.根据权利要求1所述的方法,其特征在于,所述数据源类型至少包括匿名访问类型、身份验证类型、以及签名验证类型中的一种;所述基于所述数据采集方式,提取与所述数据源标识相关联的数据源中的电力安全知识数据,包括:对于所述匿名...
【专利技术属性】
技术研发人员:张欣,张林,唐峰,王浩宇,张宏钊,黄炜昭,
申请(专利权)人:深圳供电局有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。