一种数据流特征整合方法、装置及电子设备制造方法及图纸

技术编号:39318060 阅读:9 留言:0更新日期:2023-11-12 16:00
本申请提供了一种数据流特征整合方法、装置及电子设备,涉及数据安全技术领域。在本申请中,首先获取第一数据流对应的第一属性数据集合和第二数据流对应的第二属性数据集合,基于第一属性数据集合中的第一属性数据和第二属性数据集合中与第一属性数据对应的第二属性数据,计算各项属性突变指标值,然后融合各项属性突变指标值,得到属性突变融合指标值,并基于属性突变融合指标值,重构第一数据流对应的第一权重值和第二数据流对应的第二权重值;最后基于第一权重值和第二权重值对第一数据流和第二数据流进行特征整合,采用这种方式,能够提升对第一数据流和第二数据流进行特征整合的准确性。征整合的准确性。征整合的准确性。

【技术实现步骤摘要】
一种数据流特征整合方法、装置及电子设备


[0001]本申请涉及数据安全
,尤其涉及一种数据流特征整合方法、装置及电子设备。

技术介绍

[0002]数据识别是企业数据资产管理和数据安全管控的基础,数据管理端在进行数据资产管理的过程中可能会接收到不同数据来源的海量数据流,数据管理端在接收到海量的数据流时,会对海量的数据流进行识别,以便于后期更好的利用和管理数据资源。
[0003]数据管理端在对海量的数据流进行识别时,数据识别的精准性依赖于数据特征的准确性,由于在海量的数据流中的任意一个数据流具有多个数据特征,且海量的数据流中的任意两个数据流可能存在相似度较高的数据特征,这会使得由海量的数据流产生的数据特征集合过于庞大且存在冗余特征,因此需要对数据流的特征进行整合。
[0004]现有的数据流特征整合方法是对多个数据流进行特征抽取和综合计算,对具有相关性的多个数据流各自设置对应的静态权重(固定权重),根据综合计算结果来对多个数据流的特征进行整合。
[0005]然而,采用上述方式,在对具有相关性的多个数据流的特征进行整合时,若多个数据流中的一个数据流的特征属性发生变化时,由于相对该类数据流设置的静态权重仍保持不变,这样会导致对该类数据流的特征进行整合的准确性降低。

技术实现思路

[0006]本专利技术申请提供了一种数据流特征整合方法、装置及电子设备,用于提升对各类数据流进行特征整合的准确性。具体技术方案如下:
[0007]第一方面,本申请提供了一种数据流特征整合方法,包括:
[0008]获取第一数据流对应的第一属性数据集合和第二数据流对应的第二属性数据集合,其中,属性数据集合是通过实时对数据流的属性进行采样得到的;
[0009]基于所述第一属性数据集合中的第一属性数据和所述第二属性数据集合中与所述第一属性数据对应的第二属性数据,计算各项属性突变指标值;
[0010]融合所述各项属性突变指标值,得到属性突变融合指标值,并基于所述属性突变融合指标值,重构所述第一数据流对应的第一权重值和所述第二数据流对应的第二权重值;
[0011]基于所述第一权重值和所述第二权重值对所述第一数据流和所述第二数据流进行特征整合。
[0012]基于上述的方法,能够实时地对第一数据流的第一属性和第二数据流的第二属性进行识别、检测;根据计算的与第一属性和第二属性相关的各项属性突变指标值,能够确定第一数据流与第二数据流之间的属性突变关系;并且根据属性突变融合指标值,可以确定实时地调整对第一数据流设置的第一权重值和第二数据流设置的第二权重值,不仅去除了
第一数据流和第二数据流之间的冗余特征信息,还提升了对第一数据流和第二数据流之间进行特征整合的准确性。
[0013]在一种可能的实现中,所述基于所述第一属性数据集合中的第一属性数据和所述第二属性数据集合中与所述第一属性数据对应的第二属性数据,计算各项属性突变指标值,包括:
[0014]从所述第一属性数据集合中选取出在一个设定采样时间段内的第一属性数据,并从所述第二属性数据集合中选取出在所述设定采样时间段内的第二属性数据,其中,一个属性数据对应一种属性特征;
[0015]基于所述第一属性数据和所述第二属性数据,计算所述第一属性数据对应的第一属性细节值和所述第二属性数据对应的第二属性细节值,并将所述第一属性细节值与所述第二属性细节值之和作为第一属性突变指标值,其中,属性细节值表征属性数据的属性的显性程度;
[0016]基于所述第一属性数据和所述第二属性数据,计算所述第一属性数据和所述第二属性数据之间的属性依存度,将所述属性依存度作为第二属性突变指标值,其中,所述属性依存度表征所述第一属性数据和所述第二属性数据的属性之间的关联程度;
[0017]基于所述第一属性数据和所述第二属性数据,计算所述第一属性数据在设定的检测样本中出现的第一频次和所述第二属性数据在所述检测样本中出现的第二频次,并将所述第一频次和所述第二频次之和作为第三属性突变指标值。
[0018]基于上述的方法,能够确定第一数据流和第二数据流之间的属性突变关系,为后续对第一数据流和第二数据流进行特征整合提供了整合依据。
[0019]在一种可能的实现中,所述融合所述各项属性突变指标值,得到属性突变融合指标值,包括:
[0020]为所述第一属性突变指标值分配对应的第一突变权重值,得到第一加权属性突变指标值;
[0021]为所述第二属性突变指标值分配对应的第二突变权重值,得到第二加权属性突变指标值;
[0022]为所述第三属性突变指标值分配对应的第三突变权重值,得到第三加权属性突变指标值;
[0023]将所述第一加权属性突变指标值、所述第二加权属性突变指标值以及所述第三加权属性突变指标值之和作为所述属性突变融合指标值。
[0024]基于上述的方法,能够得到属性突变融合指标值,并根据属性突变融合指标值所在的数值区间,调整第一数据流对应的第一权重值和第二数据流对应的第二权重值。
[0025]在一种可能的实现中,所述重构所述第一数据流对应的第一权重值和所述第二数据流对应的第二权重值,包括:
[0026]判断所述属性突变融合指标值是否小于或等于设定属性突变值;
[0027]若是,则不改变所述第一权重值和所述第二权重值;
[0028]若否,则调整所述第一权重值和所述第二权重值。
[0029]基于上述的方法,能够实时地对第一数据流对应的第一权重值和第二数据流对应的第二权重值进行调整,提升对第一数据流和第二数据流进行特征整合的准确性。
[0030]第二方面,本申请提供了一种数据流特征整合装置,包括:
[0031]数据获取模块,用于获取第一数据流对应的第一属性数据集合和第二数据流对应的第二属性数据集合,其中,属性数据集合是通过实时对数据流的属性进行采样得到的;
[0032]特征提取模块,用于基于所述第一属性数据集合中的第一属性数据和所述第二属性数据集合中与所述第一属性数据对应的第二属性数据,计算各项属性突变指标值;
[0033]数据融合模块,用于融合所述各项属性突变指标值,得到属性突变融合指标值,并基于所述属性突变融合指标值,重构所述第一数据流对应的第一权重值和所述第二数据流对应的第二权重值;
[0034]特征整合模块,用于基于所述第一权重值和所述第二权重值对所述第一数据流和所述第二数据流进行特征整合。
[0035]在一种可能的实现中,所述特征提取模块,具体用于:
[0036]从所述第一属性数据集合中选取出在一个设定采样时间段内的第一属性数据,并从所述第二属性数据集合中选取出在所述设定采样时间段内的第二属性数据,其中,一个属性数据对应一种属性特征;
[0037]基于所述第一属性数据和所述第二属性数据,计算所述第一属性数据对应的第一属性细节值和所述第二属性数据对应的第二属性细节值,并将所述第一属性细节值与所述第二属性细节值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据流特征整合方法,其特征在于,包括:获取第一数据流对应的第一属性数据集合和第二数据流对应的第二属性数据集合,其中,属性数据集合是通过实时对数据流的属性进行采样得到的;基于所述第一属性数据集合中的第一属性数据和所述第二属性数据集合中与所述第一属性数据对应的第二属性数据,计算各项属性突变指标值;融合所述各项属性突变指标值,得到属性突变融合指标值,并基于所述属性突变融合指标值,重构所述第一数据流对应的第一权重值和所述第二数据流对应的第二权重值;基于所述第一权重值和所述第二权重值对所述第一数据流和所述第二数据流进行特征整合。2.如权利要求1所述的方法,其特征在于,所述基于所述第一属性数据集合中的第一属性数据和所述第二属性数据集合中与所述第一属性数据对应的第二属性数据,计算各项属性突变指标值,包括:从所述第一属性数据集合中选取出在一个设定采样时间段内的第一属性数据,并从所述第二属性数据集合中选取出在所述设定采样时间段内的第二属性数据,其中,一个属性数据对应一种属性特征;基于所述第一属性数据和所述第二属性数据,计算所述第一属性数据对应的第一属性细节值和所述第二属性数据对应的第二属性细节值,并将所述第一属性细节值与所述第二属性细节值之和作为第一属性突变指标值,其中,属性细节值表征属性数据的属性的显性程度;基于所述第一属性数据和所述第二属性数据,计算所述第一属性数据和所述第二属性数据之间的属性依存度,将所述属性依存度作为第二属性突变指标值,其中,所述属性依存度表征所述第一属性数据和所述第二属性数据的属性之间的关联程度;基于所述第一属性数据和所述第二属性数据,计算所述第一属性数据在设定的检测样本中出现的第一频次和所述第二属性数据在所述检测样本中出现的第二频次,并将所述第一频次和所述第二频次之和作为第三属性突变指标值。3.如权利要求2所述的方法,其特征在于,所述融合所述各项属性突变指标值,得到属性突变融合指标值,包括:为所述第一属性突变指标值分配对应的第一突变权重值,得到第一加权属性突变指标值;为所述第二属性突变指标值分配对应的第二突变权重值,得到第二加权属性突变指标值;为所述第三属性突变指标值分配对应的第三突变权重值,得到第三加权属性突变指标值;将所述第一加权属性突变指标值、所述第二加权属性突变指标值以及所述第三加权属性突变指标值之和作为所述属性突变融合指标值。4.如权利要求1所述的方法,其特征在于,重构所述第一数据流对应的第一权重值和所述第二数据流对应的第二权重值,包括:判断所述属性突变融合指标值是否小于或等于设定属性突变值;若是,则不改变所述第一权重值和所述第二权重值;
若否,则调整所述第一权重值和所述第二权重值。5.一种数据流特征整合装置,其特征在于,包括:数据获取模块,用于获取第一数据流对应的第一属性数据集合和第二数据流对应的第二属性数据...

【专利技术属性】
技术研发人员:杨迪
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1