【技术实现步骤摘要】
处理数据的方法和装置
[0001]本公开涉及互联网
以及多媒体
,并且更具体地,涉及一种处理数据的方法及装置、终端设备、计算机可读存储介质以及计算机程序产品。
技术介绍
[0002]随着互联网的发展,数据量日益增长,用户在各类应用上看到推荐信息(例如,广告)的可能性越来越大,同时广告主也需要从各种广告创意/广告模板中找到适配自己产品的广告。
[0003]然而,各类应用中展示的信息中存在大量的重复数据。例如,针对广告主在广告创意搜索平台上查找适配自己产品的广告创意的场景,由于广告主在投放广告的过程中,存在不同程度的复制行为,如直接复制广告、广告元素中少量内容变化等,直接抓取广告的投放信息的广告创意搜索平台上往往会展示大量重复或相似度极高的广告创意。又例如,针对向用户推送广告的场景,由于展示广告信息的应用往往根据单一指标(例如曝光量)来向用户展示广告,因此用户也往往会被多次推送相似度极高的广告,导致用户体验不高。
[0004]因此,需要对现有的处理推荐数据的方案进行改进,以解决现有的各类应用中展示的信息重复度高、指标单一的问题。
技术实现思路
[0005]为了解决上述问题,本公开提供了一种处理数据的方法及装置、终端设备、计算机可读存储介质以及计算机程序产品。
[0006]根据本公开实施例的一个方面,提供了一种处理数据的方法,包括:将推荐数据集中的多个推荐数据按照推荐数据间的相似度进行聚合,以生成多个推荐数据特征标识符,其中每个推荐数据特征标识符用于标识彼此之间相似度高于 ...
【技术保护点】
【技术特征摘要】
1.一种处理数据的方法,包括:将推荐数据集中的多个推荐数据按照推荐数据间的相似度进行聚合,以生成多个推荐数据特征标识符,其中每个推荐数据特征标识符用于标识彼此之间相似度高于阈值的多个推荐数据;基于每个推荐数据特征标识符对应的多个推荐数据的日志信息,从所述多个推荐数据中选择所述推荐数据特征标识符对应的代表推荐数据,以生成代表推荐数据集,所述代表推荐数据集包括全部或部分推荐数据特征标识符对应的代表推荐数据;基于所述代表推荐数据集中的每个代表推荐数据的推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签,所述分类标签为业务标签树中的叶子节点对应的业务标签,所述业务标签树包括以业务标签标识的多个父节点和多个叶子节点,并且所述多个父节点和多个叶子节点具有树形层级关系;以及基于各个代表推荐数据对应的多个分类标签,生成待展示信息。2.如权利要求1所述的方法,其中,所述将推荐数据集中的多个推荐数据按照推荐数据间的相似度进行聚合还包括:基于所述推荐数据集中的各个推荐数据对应的图像数据,计算各个推荐数据对应的推荐数据特征标识符,以使得具有相同的推荐数据特征标识符的推荐数据相似;其中,所述推荐数据集中的各个推荐数据对应的图像数据包括以下各项中的至少一项:所述各个推荐数据的图片数据、所述各个推荐数据的视频数据的关键帧对应的图片数据、或所述各个推荐数据的视频数据的封面图片数据。3.如权利要求2所述的方法,其中,所述计算各个推荐数据对应的推荐数据特征标识符,还包括:将所述各个推荐数据对应的图像数据从像素域转换到频率域,以获取所述各个推荐数据对应的频域图像数据;基于所述各个推荐数据对应的频域图像数据,计算低频区域的频域图像数据的均值;以及基于所述低频区域的频域图像数据的均值,计算所述低频区域的频域图像数据对应的二值化序列,并将所述二值化序列作为所述推荐数据特征标识符。4.如权利要求1所述的方法,其中,所述基于所述代表推荐数据集中的每个代表推荐数据的推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签还包括:获取所述代表推荐数据对应的视频数据、音频数据、文本数据、图片数据中的一项或多项;基于所述视频数据、音频数据、文本数据、图片数据中的一项或多项,分别确定所述代表推荐数据对应的视频特征、音频特征、文本特征、图片特征中的一项或多项;以及基于所述视频特征、音频特征、文本特征、图片特征中的一项或多项,确定所述代表推荐数据的推荐数据表示向量,并基于所述推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签。5.如权利要求1所述的方法,其中,所述确定所述代表推荐数据对应的多个分类标签还包括:获取所述业务标签树,所述业务标签树的二级节点包括拍摄方式业务标签、营销卖点
业务标签和视频场景业务标签中的至少一项,以及基于所述推荐数据表示向量与所述业务标签树中的多个叶子节点的业务标签相匹配的概率,确定所述代表推荐数据对应的多个分类标签。6.如权利要求1所述的方法,其中,所述每个推荐数据特征标识符对应的多个推荐数据的日志信息包括以下各项中的至少一项或多项:曝光量、点击量、转换量、播放量、完播率和推广类型。7.如权利要求1所述的方法,其中,所述生成代表推荐数据集还包括:基于各个推荐数据特征标识符对应的代表推荐数据的日志信息,对各个代表推荐数据进行排序;以及基于排序后的各个代表推荐数据,生成所述代表推荐数据集,所述代表推荐数据集包括全部或部分推荐数据特征标识符对应的代表推荐数据。8.如权利要求1所述的方法,其中,所述基于所述代表推荐数据集中的每个代表推荐数据的推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签还包括:获取所述代表推荐数据对应的业务信息,所述业务信息包括以下各项中的至少一项:图片数据链接、图片数据标识符、图片数据格式、图片数据尺寸、图片数据生成方式、视频数据链接、视频数据标识符、视频数据格式、视频数据尺寸、视频数据生成方式、视频数据时长、...
【专利技术属性】
技术研发人员:李亦程,郑灿,陈朋瑶,王雪彬,谢振宇,严荣,牛文昊,鲁京墨,齐行君,徐雯倩,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。