一种内容检测方法、装置及设备制造方法及图纸

技术编号:35106184 阅读:15 留言:0更新日期:2022-10-01 17:16
本申请公开了一种内容检测方法、装置及设备,提取目标内容数据的内容特征向量,目标内容数据的内容特征向量由至少一种目标素材特征向量组成。获取目标用户账户对应的用户特征向量。将目标内容数据的内容特征向量和目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中,获取每种目标素材特征向量分别对应的权重。内容检测模型是基于内容数据的内容特征向量、用户账户的用户特征向量以及用户账户针对内容数据的行为类别标签训练得到的,用于输出目标用户账户针对目标内容数据的行为类别的预测结果。如此,在不投放目标内容数据的基础上,利用内容检测模型,便可预测目标用户账户对目标内容数据中各个素材的喜爱程度。程度。程度。

【技术实现步骤摘要】
一种内容检测方法、装置及设备


[0001]本申请涉及互联网
,具体涉及一种内容检测方法、装置及设备。

技术介绍

[0002]用户在上传多种多媒体素材后,可以通过多媒体素材的不同组合方式生成大量的多媒体数据并发布。例如,多媒体素材具体为广告素材且多媒体数据为视频数据时,通过将不同的广告素材进行多种方式的组合,可以生成多种不同的广告视频数据并发布。然而,发布的多媒体数据并不是都受用户喜欢。因此,要对多媒体素材进行分析以确定用户喜欢的多媒体素材,由用户喜欢的多媒体素材所组成的多媒体数据为优质多媒体数据。
[0003]目前,可先将大量的多媒体数据投放,再更改已投放的多媒体数据中的素材并重新投放。进而,通过比对用户对更改素材前的多媒体数据的行为信息以及对更改素材后的多媒体数据的行为信息来对多媒体数据中的素材进行评估。但是,当素材过多,组合量级显著增加时,投放的成本是过高。

技术实现思路

[0004]有鉴于此,本申请实施例提供一种内容检测方法、装置及设备,能够在减少投放成本的基础上,有效对目标内容数据中的素材进行归因。
[0005]为解决上述问题,本申请实施例提供的技术方案如下:
[0006]第一方面,本申请实施例提供一种内容检测方法,所述方法包括:
[0007]提取目标内容数据的内容特征向量;所述目标内容数据的内容特征向量由至少一种目标素材特征向量组成;
[0008]获取目标用户账户对应的用户特征向量;
[0009]将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中,获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重;所述内容检测模型用于输出所述目标用户账户针对所述目标内容数据的行为类别的预测结果;所述内容检测模型是基于内容数据的内容特征向量、用户账户的用户特征向量以及所述用户账户针对所述内容数据的行为类别标签训练得到的。
[0010]第二方面,本申请实施例提供一种内容检测装置,所述装置包括:
[0011]提取单元,用于提取目标内容数据的内容特征向量;所述目标内容数据的内容特征向量由至少一种目标素材特征向量组成;
[0012]第一获取单元,用于获取目标用户账户对应的用户特征向量;
[0013]第二获取单元,用于将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中,获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重;所述内容检测模型用于输出所述目标用户账户针对所述目标内容数据的行为类别的预测结果;所述内容检测模型是基于内容数据的内容特征向量、用户账户的用户特征向量以及所述用户账户针对所述内容数据的行为类别标签训练
得到的。
[0014]第三方面,本申请实施例提供一种电子设备,包括:
[0015]一个或多个处理器;
[0016]存储装置,其上存储有一个或多个程序,
[0017]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一所述的内容检测方法。
[0018]第四方面,本申请实施例提供一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如上述任一所述的内容检测方法。
[0019]第五方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如上述任一所述内容检测方法。
[0020]由此可见,本申请实施例具有如下有益效果:
[0021]本申请实施例提供了一种内容检测方法、装置及设备,提取目标内容数据的内容特征向量,目标内容数据的内容特征向量由至少一种目标素材特征向量组成。另外,获取目标用户账户对应的用户特征向量。将目标内容数据的内容特征向量和目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中,获取交叉注意力模块输出的每种目标素材特征向量分别对应的权重。其中,内容检测模型是基于内容数据的内容特征向量、用户账户的用户特征向量以及用户账户针对内容数据的行为类别标签训练得到的,用于输出目标用户账户针对目标内容数据的行为类别的预测结果。可知,每种目标素材特征向量分别对应的权重能够表征目标用户账户对目标内容数据中每个素材的喜爱程度。如此,在不投放目标内容数据的基础上,利用内容检测模型,便可预测目标用户账户对目标内容数据中各个素材的喜爱程度。该内容检测模型可复用且可迁移,能够降低投放成本。
附图说明
[0022]图1为本申请实施例提供的一种示例性应用场景的框架示意图;
[0023]图2为本申请实施例提供的一种内容检测模型的训练方法的流程图;
[0024]图3为本申请实施例提供的一种内容检测模型的示意图;
[0025]图4为本申请实施例提供的一种提取内容数据的内容特征向量的示意图;
[0026]图5为本申请实施例提供的另一种示例性应用场景的框架示意图;
[0027]图6为本申请实施例提供的一种内容检测方法的流程图;
[0028]图7为本申请实施例提供的一种内容检测装置的结构示意图;
[0029]图8为本申请实施例提供的一种电子设备的基本结构的示意图。
具体实施方式
[0030]为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
[0031]为了便于理解和解释本申请实施例提供的技术方案,先对本申请实施例中所涉及到的
技术介绍
进行介绍。
[0032]多媒体数据的生成涉及多种多媒体素材的组合。例如,多媒体素材为不同的视频
片段、封面、标题等。用户在上传多种多媒体素材后,可以通过多媒体素材的不同组合方式生成大量的多媒体数据并投放到平台。然而,发布的多媒体数据并不是都受用户喜欢。因此,要对多媒体素材进行分析以确定用户喜欢的多媒体素材,由用户喜欢的多媒体素材所组成的多媒体数据为优质多媒体数据。分析用户喜欢的多媒体素材的过程可称为归因分析。
[0033]目前,可先将大量的多媒体数据投放,再更改已投放的多媒体数据中的素材并重新投放。进而,通过比对用户对更改素材前的多媒体数据的行为信息以及对更改素材后的多媒体数据的行为信息来对多媒体数据中的素材进行评估。行为信息包括点击、点赞或完播,以点击为例,可通过比对用户对更改素材前的多媒体数据的点击率以及对更改素材后的多媒体数据的点击率来对素材进行评估。但是,当素材过多,组合量级显著增加时,投放的成本是过高。
[0034]基于此,本申请实施例提供了一种内容检测方法、装置及设备,提取目标内容数据的内容特征向量,目标内容数据的内容特征向量由至少一种目标素材特征向量组成。另外,获取目标用户账户对应的用户特征向量。将目标内容数据的内容特征向量和目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中,获取交叉注意力模块输出的每种目标素材特征向量分别对应的权重。其中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容检测方法,其特征在于,所述方法包括:提取目标内容数据的内容特征向量;所述目标内容数据的内容特征向量由至少一种目标素材特征向量组成;获取目标用户账户对应的用户特征向量;将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中,获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重;所述内容检测模型用于输出所述目标用户账户针对所述目标内容数据的行为类别的预测结果;所述内容检测模型是基于内容数据的内容特征向量、用户账户的用户特征向量以及所述用户账户针对所述内容数据的行为类别标签训练得到的。2.根据权利要求1所述的方法,其特征在于,所述内容检测模型的训练过程,包括:提取内容数据的内容特征向量;所述内容数据的内容特征向量由至少一种素材特征向量组成;获取用户账户的用户特征向量;将所述内容数据的内容特征向量和所述用户账户的用户特征向量输入交叉注意力模块,获取所述交叉注意力模块输出的每种素材特征向量分别对应的权重;基于所述每种素材特征向量以及所述每种素材特征向量分别对应的权重进行加权求和,将加权求和后得到的向量确定为更新后的内容特征向量;利用所述更新后的内容特征向量、所述用户账户的用户特征向量以及所述用户账户针对所述内容数据的行为类别标签,训练内容检测模型;所述内容检测模型包括所述交叉注意力模块。3.根据权利要求1所述的方法,其特征在于,所述将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中,获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重,包括:将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中,通过所述交叉注意力模块计算所述目标用户账户的用户特征向量和第一权重的乘积,获取第一值,计算所述目标内容数据的内容特征向量和第二权重的乘积,获取第二值;由所述第一值以及所述第二值计算每种目标素材特征向量分别对应的权重,获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重。4.根据权利要求1所述的方法,其特征在于,当所述目标内容数据的数量为多组、所述目标用户账户包括多个子用户账户且所述目标内容数据的数量和所述子用户账户的数量相同时,所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重为多个,所述获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重,包括:将所述目标素材特征向量对应的多个权重的平均值确定为所述目标素材特征向量对应的权重,以获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重。5.根据权利要求1所述的方法,其特征在于,在所述提取目标内容数据的内容特征向量之后,所述将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中之前,所述方法还包括:将所述目标素材特征向量输入对应的降维模型中,以获取降维后的目标素材特征向
量;所述降维模型是根据降维前的历史素材特征向量和降维后的历史素材特征向量进行训练得到的;由所述降维后的目标素材特征向量重新组成所述目标内容数据的内容特征向量。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:将目标内容数据标识以及所述降维后的目标素材特征向量按照键值对存储结构进行存储。7.根据权利要求1所述的方法,其特征在于,所述提取目标内容...

【专利技术属性】
技术研发人员:余席宇余俊周文卢靓妮
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1