多特征库合并方法及装置、设备、计算机可读存储介质制造方法及图纸

技术编号:36521708 阅读:28 留言:0更新日期:2023-02-01 15:57
本申请的实施例揭示了多特征库合并方法及装置、设备、计算机可读存储介质。该方法包括:获取从多个子特征库中进行特征采样所得到的特征集;基于所述特征集确定特征融合计算指标,所述特征融合计算指标包括特征细节值、特征依存度、特征频度中的至少一种;根据所述特征融合计算指标确定特征融合指标,并基于所述特征融合指标确定目标特征合并方式;按照所述目标特征合并方式对所述多个子特征库进行特征合并,以得到目标特征库。本申请的实施例通过采样少量的特征来实现对于多特征库中大量特征的把控,进而选择合适的方式来对多个子特征库进行特征合并,使得所得到的目标特征库能够避免出现特征重复程度高的问题。够避免出现特征重复程度高的问题。够避免出现特征重复程度高的问题。

【技术实现步骤摘要】
多特征库合并方法及装置、设备、计算机可读存储介质


[0001]本申请涉及数据安全
,具体涉及一种多特征库合并方法及装置、设备、计算机可读存储介质。

技术介绍

[0002]对数据资产进行识别是数据安全管理的首要步骤,构建特征库则是数据识别的基础。
[0003]特征库的构建基于对数据的汇总、识别和特征抽取等操作步骤,受制于数据汇聚难度、计算压力等因素,在实际操作中通常是先将部分数据生成多个子特征库,再将多个子特征库直接进行合并,形成最终的特征库。这种特征库合并方式虽然速度很快,但是最终所形成的特征库中存在特征重复冗余较高的问题。

技术实现思路

[0004]为解决上述技术问题,本申请的实施例分别提供了一种多特征库合并方法、装置、设备和计算机可读存储介质。
[0005]根据本申请实施例的一个方面,提供了一种多特征库合并方法,包括:获取从多个子特征库中进行特征采样所得到的特征集;基于所述特征集确定特征融合计算指标,所述特征融合计算指标包括特征细节值、特征依存度、特征频度中的至少一种,所述特征细节值表征所述特征集中特征本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多特征库合并方法,其特征在于,所述方法包括:获取从多个子特征库中进行特征采样所得到的特征集;基于所述特征集确定特征融合计算指标,所述特征融合计算指标包括特征细节值、特征依存度、特征频度中的至少一种,所述特征细节值表征所述特征集中特征的细节程度,所述特征依存度表征所述特征集中特征之间的关联程度,所述特征频度表征所述特征集中特征的出现频次;根据所述特征融合计算指标确定特征融合指标,并基于所述特征融合指标确定目标特征合并方式;按照所述目标特征合并方式对所述多个子特征库进行特征合并,以得到目标特征库。2.根据权利要求1所述的方法,其特征在于,所述获取从多个子特征库中进行特征采样所得到的特征集,包括:获取对数据分散进行处理所形成的多个子特征库;在对所述多个子特征库进行特征合并以形成所述目标特征库的过程中,对各个特征库中的特征数据进行特征采样,以得到所述特征集。3.根据权利要求2所述的方法,其特征在于,所述对各个特征库中的特征数据进行特征采样,包括:按照预设的采样周期从各个特征库中抽取预设特征数量的特征数据;或者,根据各个子特征库中的特征数据传输至所述目标特征库的数据传输量和预设比例,计算各个子特征库中待采样的特征数量,以从各个子特征库中分别抽取对应特征数量的特征数据。4.根据权利要求1所述的方法,其特征在于,所述基于所述特征集确定特征融合计算指标,包括:获取所述特征集中特征的显性维度指标、显性粒径和细节颗粒度中位数;根据所述显性维度指标、所述显性粒径和所述细节颗粒度中位数,计算得到所述特征细节值。5.根据权利要求1所述的方法,其特征在于,所述基于所述特征集确定特征融合计算指标,包括:对所述特征集中的特征进行向量化处理,得到各特征在向量空间中的三维坐标;获取所述特征集中任意两特征在不同二维空间中与中心点的偏移度,并获取所述任意两特征在所述不同二维空间中的偏移度之间距离;根据所述任意两特征对应的所述偏移度和所述距离计算所述特征依存度。6.根据权利要求1所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:杨迪
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1