素材数据聚类方法及相关装置制造方法及图纸

技术编号:39040910 阅读:13 留言:0更新日期:2023-10-10 11:53
本申请实施例公开了一种素材数据聚类方法及相关装置,方法包括:标注素材数据,得到素材评估集,其中,素材数据对应预设应用场景;对素材数据进行处理,生成素材数据中图片数据和对应文本数据对应的联合语义表征数据;根据素材评估集,对联合语义表征数据进行聚类,得到素材聚类结果;对素材聚类结果进行优化处理,得到目标素材聚类结果。采用本申请实施例有利于提高用户体验。于提高用户体验。于提高用户体验。

【技术实现步骤摘要】
素材数据聚类方法及相关装置


[0001]本申请涉及电子设备
,具体涉及一种素材数据聚类方法及相关装置。

技术介绍

[0002]随着互联网兴起,越来越多的人在网络上投入了大量的时间和精力,我们的生活也越来越离不开互联网。
[0003]作为一种触达用户效率极高的载体,互联网广告也越来越受到各种品牌方的青睐,越来越多的广告主会选择在互联网投放广告触达用户,宣传品牌价值。为用户提供精准的推荐,提升用户使用互联网的体验也是平台方需要关注的。
[0004]其中,广告的播放作为重要的一环需要关注提升用户的体验。目前展示给用户的广告主要是广告素材图片和广告文案等,当同一页展示素材类似的广告时,会使用户感觉重复推送,会大大降低用户的体验。

技术实现思路

[0005]本申请实施例提供了一种素材数据聚类方法及相关装置,可以将广告应用场景中的图片数据和文本数据进行聚类,有利于提升检索性能;并将素材聚类结果优化处理,以适配其应用场景,有利于减少相似的素材数据,有利于提高用户体验。
[0006]第一方面,本申请实施例提供一种素材数据聚类方法,应用于电子设备,所述方法包括:
[0007]标注素材数据,得到素材评估集,其中,所述素材数据对应预设应用场景;
[0008]对所述素材数据进行处理,生成所述素材数据中图片数据和对应文本数据对应的联合语义表征数据;
[0009]根据所述素材评估集,对所述联合语义表征数据进行聚类,得到素材聚类结果;
[0010]对所述素材聚类结果进行优化处理,得到目标素材聚类结果。
[0011]第二方面,本申请实施例提供一种素材数据聚类装置,所述装置应用于电子设备,所述装置包括:标注单元、生成单元、聚类单元和优化单元,其中,
[0012]所述标注单元,用于标注素材数据,得到素材评估集,其中,所述素材数据对应预设应用场景;
[0013]所述生成单元,用于对所述素材数据进行处理,生成所述素材数据中图片数据和对应文本数据对应的联合语义表征数据;
[0014]所述聚类单元,用于根据所述素材评估集,对所述联合语义表征数据进行聚类,得到素材聚类结果;
[0015]所述优化单元,用于对所述素材聚类结果进行优化处理,得到目标素材聚类结果。
[0016]第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。
[0017]第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。
[0018]第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
[0019]可以看出,本申请实施例中,标注素材数据,得到素材评估集,其中,所述素材数据对应预设应用场景;对所述素材数据进行处理,生成所述素材数据中图片数据和对应文本数据对应的联合语义表征数据;根据所述素材评估集,对所述联合语义表征数据进行聚类,得到素材聚类结果;对所述素材聚类结果进行优化处理,得到目标素材聚类结果。如此,可以将预设应用场景中的图片数据和文本数据进行聚类,有利于提升检索性能;并将素材聚类结果优化处理,以适配其应用场景,有利于减少相似的素材数据,有利于提高用户体验。
附图说明
[0020]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本申请实施例提供的一种素材数据聚类系统的结构示意图;
[0022]图2A是本申请实施例提供的一种素材数据聚类方法的流程示意图;
[0023]图2B是本申请实施例提供的一种聚类ID增量交互流程示意图;
[0024]图3是本申请实施例提供的一种电子设备的结构示意图;
[0025]图4是本申请实施例提供的一种素材数据聚类装置的功能单元组成框图。
具体实施方式
[0026]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0027]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
[0028]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0029]电子设备可以是还包含其它功能诸如个人数字助理和/或音乐播放器功能的便携式电子设备,诸如手机、平板电脑、终端设备、具备无线通讯功能的可穿戴电子设备(如智能手表、智能眼镜)、车载设备等。便携式电子设备的示例性实施例包括但不限于搭载IOS系统、Android系统、Microsoft系统或者其它操作系统的便携式电子设备。上述便携式电子设备也可以是其它便携式电子设备,诸如膝上型计算机(Laptop)等。还应当理解的是,在其他一些实施例中,上述电子设备也可以不是便携式电子设备,而是台式计算机。在一些实施例中,该电子设备包括显示屏;在一些实施例中,该电子设备还可以包括虚拟现实设备。
[0030]随着互联网兴起,越来越多的人在网络上投入了大量的时间和精力,我们的生活也越来越离不开互联网。作为一种触达用户效率极高的载体,互联网广告也越来越受到各种品牌方的青睐,越来越多的广告主会选择在互联网投放广告触达用户,宣传品牌价值。作为平台方,需要为用户提供精准的推荐,提升用户使用互联网的体验,同时也需要提升广告投放效率和转化效率,以提升平台的利用率,实现平台和用户双赢。而播放广告作为其中重要的一环需要关注提升本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种素材数据聚类方法,应用于电子设备,其特征在于,包括:标注素材数据,得到素材评估集,其中,所述素材数据对应预设应用场景;对所述素材数据进行处理,生成所述素材数据中图片数据和对应文本数据对应的联合语义表征数据;根据所述素材评估集,对所述联合语义表征数据进行聚类,得到素材聚类结果;对所述素材聚类结果进行优化处理,得到目标素材聚类结果。2.根据权利要求1所述的方法,其特征在于,所述图片数据包括多个素材图片;所述标注素材数据,得到素材评估集,包括:对所述素材数据中的多个素材图片按照类别进行标注,得到标注以后的多个所述素材图片,其中,每一所述素材图片对应一个标注信息;将所述标注以后的所述多个素材图片作为所述素材评估集。3.根据权利要求2所述的方法,其特征在于,所述对所述素材数据进行处理,生成所述素材数据中图片数据和对应文本数据对应的联合语义表征数据,包括:对每一所述素材图片进行处理,得到所述多个素材数据对应的文本数据;将所述文本数据和所述图片数据映射到同一个语义空间;通过跨模态对比学习,得到所述文本数据和所述图片数据对应的所述联合语义表征数据,其中,所述联合语义表征数据包括多个联合语义表征特征向量,每一所述素材图片和对应所述图片数据对应有一个所述联合语义表征特征向量。4.根据权利要求2或3所述的方法,其特征在于,所述素材数据对应数据库,所述素材聚类结果包括多个子素材聚类结果,每一所述素材图片对应至少一个所述子素材聚类结果;所述根据所述素材评估集,对所述联合语义表征数据进行聚类,得到素材聚类结果,包括:对每一所述素材图片执行如下聚类操作:根据所述素材图片对应的联合语义表征特征向量,将所述素材图片作为一个参考点,计算所述素材图片和所述数据库中除所述素材数据以外的每一其他素材图片之间的余弦相似度;根据所述素材图片与每一所述其他素材图片之间的余弦相似度和所述素材评估集,确定所述素材图片对应的至少一个所述子素材聚类结果;直到全部所述素材图片所述聚类操作完毕,得到每一所述素材图片对应的至少一个子素材聚类结果,将所述多个素材图片对应的多个所述子素材聚类结果作为所述素材聚类结果。5.根据权利要求4所述的方法,其特征在于,所述根据所述素材图片与每一所述其他素材图片之间的余弦相似度和所述素材评估集,确定所述素材图片对应的至少一个所述子素材聚类结果,包括:根据所述素材评估集,确定所述素材图片对应的标注信息所对应的相似度阈值;若所述余弦相似度大于或等于所述相似度阈值,则将所述其他素材图片与所述素材图片划分为同一类,并为所述素材图片打上聚类ID,将所述其他素材图片作为所述素...

【专利技术属性】
技术研发人员:刘曙铭
申请(专利权)人:成都欧珀通信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1