处理数据的方法和装置制造方法及图纸

技术编号:37469830 阅读:16 留言:0更新日期:2023-05-06 09:49
本公开提供了一种处理数据的方法及装置、终端设备、计算机可读存储介质以及计算机程序产品。本公开的各个方面,改进了推荐数据在数据链路中的聚合环节,并结合了智能生成推荐数据的分类标签,生成了低重复度的、多维度的待展示信息,解决了现有的处理推荐数据的方案中的展示的信息重复度高、指标单一的技术问题。指标单一的技术问题。指标单一的技术问题。

【技术实现步骤摘要】
处理数据的方法和装置


[0001]本公开涉及互联网
以及多媒体
,并且更具体地,涉及一种处理数据的方法及装置、终端设备、计算机可读存储介质以及计算机程序产品。

技术介绍

[0002]随着互联网的发展,数据量日益增长,用户在各类应用上看到推荐信息(例如,广告)的可能性越来越大,同时广告主也需要从各种广告创意/广告模板中找到适配自己产品的广告。
[0003]然而,各类应用中展示的信息中存在大量的重复数据。例如,针对广告主在广告创意搜索平台上查找适配自己产品的广告创意的场景,由于广告主在投放广告的过程中,存在不同程度的复制行为,如直接复制广告、广告元素中少量内容变化等,直接抓取广告的投放信息的广告创意搜索平台上往往会展示大量重复或相似度极高的广告创意。又例如,针对向用户推送广告的场景,由于展示广告信息的应用往往根据单一指标(例如曝光量)来向用户展示广告,因此用户也往往会被多次推送相似度极高的广告,导致用户体验不高。
[0004]因此,需要对现有的处理推荐数据的方案进行改进,以解决现有的各类应用中展示的信息重复度高、指标单一的问题。

技术实现思路

[0005]为了解决上述问题,本公开提供了一种处理数据的方法及装置、终端设备、计算机可读存储介质以及计算机程序产品。
[0006]根据本公开实施例的一个方面,提供了一种处理数据的方法,包括:将推荐数据集中的多个推荐数据按照推荐数据间的相似度进行聚合,以生成多个推荐数据特征标识符,其中每个推荐数据特征标识符用于标识彼此之间相似度高于阈值的多个推荐数据;基于每个推荐数据特征标识符对应的多个推荐数据的日志信息,从所述多个推荐数据中选择所述推荐数据特征标识符对应的代表推荐数据,以生成代表推荐数据集,所述代表推荐数据集包括全部或部分推荐数据特征标识符对应的代表推荐数据;基于所述代表推荐数据集中的每个代表推荐数据的推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签,所述分类标签为业务标签树中的叶子节点对应的业务标签,所述业务标签树包括以业务标签标识的多个父节点和多个叶子节点,并且所述多个父节点和多个叶子节点具有树形层级关系;以及基于各个代表推荐数据对应的多个分类标签,生成待展示信息。
[0007]根据本公开实施例的一个方面,提供了一种终端设备,所述终端设备包括一个或多个处理器、一个或多个存储器、显示屏幕、发送器、接收器,其中,所述发送器被配置为发送推荐数据查询请求,所述推荐数据查询请求中包括用于查找推荐数据的标签信息,所述标签信息包括至少一个业务标签;所述接收器被配置为接收待展示信息,所述待展示信息包括与所述标签信息对应的多个代表推荐数据的信息;所述处理器被配置为处理所述待展示信息,并渲染显示界面;所述显示屏幕被配置为显示所述显示界面,所述显示界面显示所
述标签信息对应的多个代表推荐数据的图片,所述多个代表推荐数据互不相似。
[0008]根据本公开实施例的一个方面,提供了一种处理推荐数据的装置,包括:一个或多个处理器;以及一个或多个存储器,其中所述存储器中存储有计算机可读代码,所述计算机可读代码在由所述一个或多个处理器运行时,使得所述一个或多个处理器执行如上述的方法。
[0009]根据本公开实施例的另一方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令在被处理器执行时,使得所述处理器执行如本公开上述各个方面中任一项所述的方法。
[0010]根据本公开实施例的另一方面,提供了一种计算机程序产品,其包括计算机可读指令,所述计算机可读指令在被处理器执行时,使得所述处理器执行如本公开上述各个方面中任一项所述的方法。
[0011]本公开上述各个方面,改进了推荐数据在数据链路中的聚合环节,并结合了智能生成推荐数据的分类标签,生成了低重复度的、多维度的待展示信息,解决了现有的处理推荐数据的方案中的展示的信息重复度高、指标单一的技术问题。
附图说明
[0012]通过结合附图对本公开实施例进行更详细的描述,本公开实施例的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0013]图1示出了根据本公开实施例的应用场景的示意图。
[0014]图2示出了一种传统的广告创意展示的示例界面。
[0015]图3示出了根据本公开实施例的处理数据的方法的流程图。
[0016]图4示出了根据本公开实施例的处理数据的方法的示意图。
[0017]图5示出了根据本公开实施例的生成推荐数据特征标识符的方案的示意图。
[0018]图6示出了根据本公开实施例的选择代表推荐数据的方案的示意图。
[0019]图7示出了根据本公开实施例的生成代表推荐数据的推荐数据表示向量的方案的示意图。
[0020]图8示出了根据本公开实施例的业务标签树的示意图。
[0021]图9示出了根据本公开实施例的终端展示界面的示意图。
[0022]图10示出了根据本公开实施例的终端展示界面的又一示意图。
[0023]图11示出了根据本公开实施例的示例性计算设备的架构的示意图。
具体实施方式
[0024]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0025]本公开的实施例可以是基于人工智能(Artificial intelligence,AI)的。人工智
能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。例如,对于本公开的实施例而言,其能够以类似于人类判断在海量的推荐数据(例如广告数据)中筛掉重复度高的推荐数据并判断推荐数据的分类标签。人工智能通过研究各种智能机器的设计原理与实现方法,使本公开实施例具有理解用户行为,并推理和处理用户喜好的功能。人工智能技术涉及领域广泛,既有硬件层面的技术也有软件层面的技术。其中,人工智能软件技术主要包括计算机视觉技术、自然语言处理和机器学习/深度学习、自动驾驶、智慧交通等几大方向。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
[0026]此外本公开的实施例还涉本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种处理数据的方法,包括:将推荐数据集中的多个推荐数据按照推荐数据间的相似度进行聚合,以生成多个推荐数据特征标识符,其中每个推荐数据特征标识符用于标识彼此之间相似度高于阈值的多个推荐数据;基于每个推荐数据特征标识符对应的多个推荐数据的日志信息,从所述多个推荐数据中选择所述推荐数据特征标识符对应的代表推荐数据,以生成代表推荐数据集,所述代表推荐数据集包括全部或部分推荐数据特征标识符对应的代表推荐数据;基于所述代表推荐数据集中的每个代表推荐数据的推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签,所述分类标签为业务标签树中的叶子节点对应的业务标签,所述业务标签树包括以业务标签标识的多个父节点和多个叶子节点,并且所述多个父节点和多个叶子节点具有树形层级关系;以及基于各个代表推荐数据对应的多个分类标签,生成待展示信息。2.如权利要求1所述的方法,其中,所述将推荐数据集中的多个推荐数据按照推荐数据间的相似度进行聚合还包括:基于所述推荐数据集中的各个推荐数据对应的图像数据,计算各个推荐数据对应的推荐数据特征标识符,以使得具有相同的推荐数据特征标识符的推荐数据相似;其中,所述推荐数据集中的各个推荐数据对应的图像数据包括以下各项中的至少一项:所述各个推荐数据的图片数据、所述各个推荐数据的视频数据的关键帧对应的图片数据、或所述各个推荐数据的视频数据的封面图片数据。3.如权利要求2所述的方法,其中,所述计算各个推荐数据对应的推荐数据特征标识符,还包括:将所述各个推荐数据对应的图像数据从像素域转换到频率域,以获取所述各个推荐数据对应的频域图像数据;基于所述各个推荐数据对应的频域图像数据,计算低频区域的频域图像数据的均值;以及基于所述低频区域的频域图像数据的均值,计算所述低频区域的频域图像数据对应的二值化序列,并将所述二值化序列作为所述推荐数据特征标识符。4.如权利要求1所述的方法,其中,所述基于所述代表推荐数据集中的每个代表推荐数据的推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签还包括:获取所述代表推荐数据对应的视频数据、音频数据、文本数据、图片数据中的一项或多项;基于所述视频数据、音频数据、文本数据、图片数据中的一项或多项,分别确定所述代表推荐数据对应的视频特征、音频特征、文本特征、图片特征中的一项或多项;以及基于所述视频特征、音频特征、文本特征、图片特征中的一项或多项,确定所述代表推荐数据的推荐数据表示向量,并基于所述推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签。5.如权利要求1所述的方法,其中,所述确定所述代表推荐数据对应的多个分类标签还包括:获取所述业务标签树,所述业务标签树的二级节点包括拍摄方式业务标签、营销卖点
业务标签和视频场景业务标签中的至少一项,以及基于所述推荐数据表示向量与所述业务标签树中的多个叶子节点的业务标签相匹配的概率,确定所述代表推荐数据对应的多个分类标签。6.如权利要求1所述的方法,其中,所述每个推荐数据特征标识符对应的多个推荐数据的日志信息包括以下各项中的至少一项或多项:曝光量、点击量、转换量、播放量、完播率和推广类型。7.如权利要求1所述的方法,其中,所述生成代表推荐数据集还包括:基于各个推荐数据特征标识符对应的代表推荐数据的日志信息,对各个代表推荐数据进行排序;以及基于排序后的各个代表推荐数据,生成所述代表推荐数据集,所述代表推荐数据集包括全部或部分推荐数据特征标识符对应的代表推荐数据。8.如权利要求1所述的方法,其中,所述基于所述代表推荐数据集中的每个代表推荐数据的推荐数据表示向量,确定所述代表推荐数据对应的多个分类标签还包括:获取所述代表推荐数据对应的业务信息,所述业务信息包括以下各项中的至少一项:图片数据链接、图片数据标识符、图片数据格式、图片数据尺寸、图片数据生成方式、视频数据链接、视频数据标识符、视频数据格式、视频数据尺寸、视频数据生成方式、视频数据时长、...

【专利技术属性】
技术研发人员:李亦程郑灿陈朋瑶王雪彬谢振宇严荣牛文昊鲁京墨齐行君徐雯倩
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1