数据处理方法、装置、存储介质和计算设备制造方法及图纸

技术编号:33635840 阅读:20 留言:0更新日期:2022-06-02 01:48
本公开的实施方式提供了一种数据处理方法、装置、存储介质和计算设备。包括:接收至少两个素材展示位分别对应的第一素材集合;针对每个素材展示位对应的第一素材集合,根据所述第一素材集合中素材对应的素材类型和用户标识,对所述第一素材集合中相同用户标识的素材进行去重,得到包含去重后的素材的第二素材集合;根据所述第二素材集合中素材对应的素材类型和用户标识,对所述第二素材集合之间相同用户标识的素材进行去重,得到每个素材展示位对应的待展示素材。应的待展示素材。应的待展示素材。

【技术实现步骤摘要】
数据处理方法、装置、存储介质和计算设备


[0001]本公开的实施方式涉及计算机
,更具体地,本公开的实施方式涉及一种数据处理方法、装置、存储介质和计算设备。

技术介绍

[0002]本部分旨在为说明书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]数据处理一般是指根据业务需求对数据进行一定业务逻辑的处理,例如对已有数据中相同或相似数据进行去重的处理。
[0004]以数据去重业务来说,相关技术中一般是基于数据维度进行去重的。例如,通过计算不同数据的数字摘要从而确定数据唯一对应的数据标识(如通过哈希算法计算数据唯一对应的哈希值);由于不同数据对应的是不同的数据标识,因此可以利用出现过的数据标识对后续的数据进行去重,即当某个数据的数据标识已经存在,则说明该数据已存在,属于重复数据。
[0005]然而,在实际应用时如果在原有数据基础上进行修改哪怕是细微改动,也会导致数据的数据标识发生变化;虽然这样情况应当认定为重复数据,但由于数据标识不同所以难以识别这类相似数据,从而导本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:接收至少两个素材展示位分别对应的第一素材集合;针对每个素材展示位对应的第一素材集合,根据所述第一素材集合中素材对应的素材类型和用户标识,对所述第一素材集合中相同用户标识的素材进行去重,得到包含去重后的素材的第二素材集合;根据所述第二素材集合中素材对应的素材类型和用户标识,对所述第二素材集合之间相同用户标识的素材进行去重,得到每个素材展示位对应的待展示素材。2.根据权利要求1所述的方法,所述根据所述第一素材集合中素材对应的素材类型和用户标识,对所述第一素材集合中相同用户标识的素材进行去重,得到包含去重后的素材的第二素材集合,包括:获取所述第一素材集合中每个素材对应的素材分值、素材类型和用户标识;其中,所述素材分值表征所述素材的优先展示程度;将所述第一素材集合中每个用户标识对应的素材分值最高的素材确定为目标素材;删除所述第一素材集合中与所述目标素材具有相同的素材类型和用户标识的非目标素材;将删除所述非目标素材后的第一素材集合确定为第二素材集合。3.根据权利要求1所述的方法,所述根据所述第一素材集合中素材对应的素材类型和用户标识,对所述第一素材集合中相同用户标识的素材进行去重,并将去重后的素材确定为第二素材集合,包括:获取所述第一素材集合中每个素材对应的素材分值、素材类型和用户标识;其中,所述素材分值表征所述素材的优先展示程度;将所述第一素材集合中每个用户标识对应的素材分值最高的素材确定为目标素材;确定所述第一素材集合中与所述目标素材具有不同的素材类型和用户标识的非目标素材;将所述目标素材和所述非目标素材加入到第二素材集合。4.根据权利要求3所述的方法,所述将所述目标素材和所述非目标素材加入到第二素材集合,包括:获取所述第二素材集合设置的承载数量;将所述目标素材和所述非目标素材按照素材分值进行排序;根据排序结果将所述目标素材和所述非目标素材依次加入到所述第二素材集合,直到加入的素材数量达到所述承载数量。5.一种数据处理方法,应用于第一服务端,包括:接收至少两个素材展示位分别对应的第一素材集合;将每个素材展示位对应的第一素材集合发送给所述素材展示位对应的第二服务端;获取每个第二服务端返回的...

【专利技术属性】
技术研发人员:杨磊张宇江慧娜蒋能学吴阳民
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1