一种基于指数衰减的标签影响度计算方法及系统技术方案

技术编号:31496235 阅读:14 留言:0更新日期:2021-12-18 12:38
本发明专利技术提供一种基于指数衰减的标签影响度计算方法及系统,涉及网络安全技术领域,对所有的标签历史数据进行整理,形成固定格式的序列数据;利用指数衰减函数分别计算出初步影响度和基于时间的频次惩罚项因子;将初步影响度和频次惩罚因子求积再求和;通过sidmoid函数得到标签影响度。本发明专利技术针对标签的影响度计算给出了分层的计算方案,实现了基于所评估标签历史数据的影响度绝对值评估,不依赖全量的标签历史数据,可用性较高。本发明专利技术通过多层衰减计算,可以合理有效地计算标签的影响度。为实体画像分析提供有力的支撑。实体画像分析提供有力的支撑。实体画像分析提供有力的支撑。

【技术实现步骤摘要】
一种基于指数衰减的标签影响度计算方法及系统


[0001]本专利技术涉及网络安全
,尤其涉及一种基于指数衰减的标签影响度计算方法及系统。

技术介绍

[0002]在数字化浪潮下,各类信息化成果持续融入人们生活的方方面面,也深刻改变着信息技术环境。一方面,以物联网、云计算、大数据等为代表的新技术得到快速应用;另一方面,传统电力、交通等行业平台联入网络,成为关键信息基础设施的有机组成。伴随信息化而来的是网络边界逐渐模糊,网络安全问题愈发突出,越来越多的敏感数字信息遭受网络攻击被窃取。
[0003]目前,解决这一问题主要以SIEM(安全信息和事件管理)、UEBA(用户与实体行为分析)相关产品为主,其中实体画像技术作为一种核心分析手段完成实体行为刻画,实现实体威胁检测,进而辅助解决网络安全问题。
[0004]但是实体画像中标签的权重计算受行业影响较大,不同的行业、不同的标签影响度计算复杂多样,面对海量的实体标签历史数据,如何合理的衡量一个标签对于一个实体的影响度,将极大的影响标签对于后续行为分析的贡献度。

技术实现思路

[0005]本专利技术提供一种基于指数衰减的标签影响度计算方法,通过多层衰减计算,可以合理有效地计算标签的影响度。
[0006]方法包括:
[0007]步骤一,对所有的标签历史数据进行整理,形成固定格式的序列数据;
[0008]步骤二,利用指数衰减函数分别计算出初步影响度和基于时间的频次惩罚项因子;
[0009]步骤三,将初步影响度和频次惩罚因子求积再求和;
[0010]步骤四,通过sidmoid函数得到标签影响度。
[0011]进一步需要说明的是,步骤一中,每一条标签对应一个时间段,计算每个时间段与当前时间段的时间差,得到一个一维的时间序列L=[d1,d2,d3,d4,d5,

]。
[0012]进一步需要说明的是,若d1=0,则说明与当前间隔0天;若d1=1,则说明与当前间隔1个时间周期。
[0013]进一步需要说明的是,时间序列L作为衰减函数的输入,计算出每条标签的初步影响度,记为I=[I1,I2,I3,I4,I5,

]。
[0014]进一步需要说明的是,步骤三中,初步影响度的计算是将时间序列L作为输入,通过时间衰减函数得到一组离散的序列值。
[0015]进一步需要说明的是,初步影响度的序列为I=[(I1,d1),(I2,d1),(I3,d1),(I4,d2),(I5,d2),(I6,d3),

],则聚合后的结果为G=[(I1,d1,3),(I4,d2,2),(I6,d3,
1),

]。
[0016]进一步需要说明的是,步骤三中,计算频次惩罚因子的方式包括:
[0017]将G中时间间隔、频次构成的数组对作为函数输入;
[0018]基于衰减函数式N(t)=N0e

λt
ꢀꢀ
(1)
[0019]λ:衰减因子,t表示时间,N0:表示t=t0时的初始量;N(t):表示N0经过t时长衰减后的值;
[0020]得到函数输出,输出即为对应的频次惩罚因子。
[0021]进一步需要说明的是,步骤四中,
[0022]取G中每个数组对应的标签初步影响度I,将I与对应的频次惩罚因子C相乘,再将乘积通过sigmoid函数产生一个(0,1)区间的输出值,该值则作为最终的标签影响度。
[0023]进一步需要说明的是,标签影响度的计算公式如下:
[0024][0025][0026]式中I表示最终的标签影响度;I
i
表示第i天的标签初步影响度;C
i
表示第i天的频次惩罚因子。
[0027]本专利技术还提供一种基于指数衰减的标签影响度计算系统,系统包括:数据整理模块、数据计算模块、数据求和模块以及标签影响度计算模块;
[0028]数据整理模块,用于对所有的标签历史数据进行整理,形成固定格式的序列数据;
[0029]数据计算模块,用于利用指数衰减函数分别计算出初步影响度和基于时间的频次惩罚项因子;
[0030]数据求和模块,用于将初步影响度和频次惩罚因子求积再求和;
[0031]标签影响度计算模块,用于通过sidmoid函数得到标签影响度。
[0032]从以上技术方案可以看出,本专利技术具有以下优点:
[0033]基于上述基于指数衰减的标签影响度计算方法,给出了分层的计算方案,实现了基于所评估标签历史数据的影响度绝对值评估,不依赖全量的标签历史数据,可用性较高。
[0034]本专利技术提出了针对标签初步影响度再次衰减的思路,并且将时间、频次作为二次衰减的自变量,解决了因历史标签数据密度过高导致的影响度不合理问题,具有较高的实用价值。
[0035]本专利技术通过多层衰减计算,可以合理有效地计算标签的影响度。为实体画像分析提供有力的支撑。
附图说明
[0036]为了更清楚地说明本专利技术的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]图1为基于指数衰减的标签影响度计算方法流程图;
[0038]图2为基于指数衰减的标签影响度计算流程图;
[0039]图3为时间衰减函数曲线图;
[0040]图4为频次惩罚因子计算示意图;
[0041]图5为基于指数衰减的标签影响度计算系统示意图。
具体实施方式
[0042]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0043]本专利技术提供的基于指数衰减的标签影响度计算方法及系统中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本专利技术的范围。
[0044]本专利技术提供的基于指数衰减的标签影响度计算方法及系统的附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0045]在本专利技术提供的基于指数衰减的标签影响度计算方法及系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于指数衰减的标签影响度计算方法,其特征在于,方法包括:步骤一,对所有的标签历史数据进行整理,形成固定格式的序列数据;步骤二,利用指数衰减函数分别计算出初步影响度和基于时间的频次惩罚项因子;步骤三,将初步影响度和频次惩罚因子求积再求和;步骤四,通过sidmoid函数得到标签影响度。2.根据权利要求1所述的基于指数衰减的标签影响度计算方法,其特征在于,步骤一中,每一条标签对应一个时间段,计算每个时间段与当前时间段的时间差,得到一个一维的时间序列L=[d1,d2,d3,d4,d5,

]。3.根据权利要求2所述的基于指数衰减的标签影响度计算方法,其特征在于,若d1=0,则说明与当前间隔0天;若d1=1,则说明与当前间隔1个时间周期。4.根据权利要求2所述的基于指数衰减的标签影响度计算方法,其特征在于,时间序列L作为衰减函数的输入,计算出每条标签的初步影响度,记为I=[I1,I2,I3,I4,I5,

]。5.根据权利要求2所述的基于指数衰减的标签影响度计算方法,其特征在于,步骤三中,初步影响度的计算是将时间序列L作为输入,通过时间衰减函数得到一组离散的序列值。6.根据权利要求5所述的基于指数衰减的标签影响度计算方法,其特征在于,初步影响度的序列为I=[(I1,d1),(I2,d1),(I3,d1),(I4,d2),(I5,d2),(I6,d3),

],则聚合后的结果为G=[(I1,d1,3),(I4,d2,2),(I6,d3,1),

]。7.根据权利要求6所...

【专利技术属性】
技术研发人员:路冰赖成宾唐上马衍硕李修明刘长秋
申请(专利权)人:中孚信息股份有限公司北京中孚泰和科技发展股份有限公司南京中孚信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1