数据聚合方法、装置、存储介质及电子设备制造方法及图纸

技术编号:33430037 阅读:19 留言:0更新日期:2022-05-19 00:20
本公开涉及一种数据聚合方法、装置、存储介质及电子设备。该方法包括:对多个多媒体数据样本中的每一多媒体数据样本进行特征提取处理,得到所述每一多媒体数据样本的特征集合,所述特征集合包括多个特征维度的特征;根据所述每一多媒体数据样本的特征集合,对所述多个多媒体数据样本进行相似度聚合,得到至少一个聚合簇;输出所述至少一个聚合簇。本公开能够提升对具有多个特征维度的多媒体数据的聚合准确性。聚合准确性。聚合准确性。

【技术实现步骤摘要】
数据聚合方法、装置、存储介质及电子设备


[0001]本公开涉及数据处理
,具体地,涉及一种数据聚合方法、装置、存储介质及电子设备。

技术介绍

[0002]随着互联网的不断发展,用户在互联网上产生的多媒体数据也越来越多,由于数据量庞大,且数据类型繁多,所以需要对这些数据进行合理地聚类,以便后续对数据进行管理和使用。

技术实现思路

[0003]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]第一方面,本公开提供一种数据聚合方法,该方法包括:
[0005]对多个多媒体数据样本中的每一多媒体数据样本进行特征提取处理,得到所述每一多媒体数据样本的特征集合,所述特征集合包括多个特征维度的特征;
[0006]根据所述每一多媒体数据样本的特征集合,对所述多个多媒体数据样本进行相似度聚合,得到至少一个聚合簇;
[0007]输出所述至少一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据聚合方法,其特征在于,包括:对多个多媒体数据样本中的每一多媒体数据样本进行特征提取处理,得到所述每一多媒体数据样本的特征集合,所述特征集合包括多个特征维度的特征;根据所述每一多媒体数据样本的特征集合,对所述多个多媒体数据样本进行相似度聚合,得到至少一个聚合簇;输出所述至少一个聚合簇。2.根据权利要求1所述的方法,其特征在于,所述根据所述每一多媒体数据样本的特征集合,对所述多个多媒体数据样本进行相似度聚合,得到至少一个聚合簇,包括:根据所述每一多媒体数据样本的特征集合,从所述多个多媒体数据样本中确定关联多媒体数据样本,所述关联多媒体数据样本是根据多个特征维度中的至少一个特征维度上的特征被划分为同一类的多媒体数据样本;通过预设算法,确定所述关联多媒体数据样本之间的相似度得分;如果所述相似度得分满足预设得分要求,则将所述关联多媒体数据样本划分至同一个聚合簇。3.根据权利要求2所述的方法,其特征在于,所述根据所述每一多媒体数据样本的特征集合,从所述多个多媒体数据样本中确定关联多媒体数据样本,包括:根据所述每一多媒体数据样本的特征集合,确定所述多个多媒体数据样本对应每一特征维度的KNN结果;基于所述多个多媒体数据样本对应每一特征维度的KNN结果,确定所述多个多媒体数据样本对应每一特征维度的聚类结果;根据所述多个多媒体数据样本对应每一特征维度的聚类结果,确定所述多个多媒体数据样本中的关联多媒体数据样本,所述聚类结果包括所述多个多媒体数据样本中每个多媒体数据样本所属的类。4.根据权利要求3所述的方法,其特征在于,所述根据所述多个多媒体数据样本对应每一特征维度的聚类结果,确定所述多个多媒体数据样本中的关联多媒体数据样本,包括:如果所述多个多媒体数据样本中的第一多媒体数据样本和第二多媒体数据样本在至少一个特征维度上的聚类结果为同一类,则将所述第一多媒体数据样本和第二多媒体数据样本,确定为关联多媒体数据样本。5.根据权利要求2所述的方法,其特征在于,所述通过预设算法,确定所述关联多媒体数据样本之间的相似度得分,包括:针对不同的特征维度,计算所述关联多媒体数据样本之间的对应每一特征维度的特征相似度;分别计算所述关联多媒体数据样本之间的对应每一特征维度的特征相似度与所述每一特征维度对应的权重值的积,得到多个积;计算所述多个积的和,并将所述多个积的和作为所述相似度得分。6.根据权利要求2所述的方法,其特征在于,所述如果所述相似度得分...

【专利技术属性】
技术研发人员:吉梁周杰黄凯毕研广
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1