一种内容检测方法、装置及设备制造方法及图纸

技术编号：35106184 阅读：15 留言：0更新日期：2022-10-01 17:16

本申请公开了一种内容检测方法、装置及设备，提取目标内容数据的内容特征向量，目标内容数据的内容特征向量由至少一种目标素材特征向量组成。获取目标用户账户对应的用户特征向量。将目标内容数据的内容特征向量和目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中，获取每种目标素材特征向量分别对应的权重。内容检测模型是基于内容数据的内容特征向量、用户账户的用户特征向量以及用户账户针对内容数据的行为类别标签训练得到的，用于输出目标用户账户针对目标内容数据的行为类别的预测结果。如此，在不投放目标内容数据的基础上，利用内容检测模型，便可预测目标用户账户对目标内容数据中各个素材的喜爱程度。程度。程度。

全部详细技术资料下载

【技术实现步骤摘要】
一种内容检测方法、装置及设备

[0001]本申请涉及互联网
，具体涉及一种内容检测方法、装置及设备。

技术介绍

[0002]用户在上传多种多媒体素材后，可以通过多媒体素材的不同组合方式生成大量的多媒体数据并发布。例如，多媒体素材具体为广告素材且多媒体数据为视频数据时，通过将不同的广告素材进行多种方式的组合，可以生成多种不同的广告视频数据并发布。然而，发布的多媒体数据并不是都受用户喜欢。因此，要对多媒体素材进行分析以确定用户喜欢的多媒体素材，由用户喜欢的多媒体素材所组成的多媒体数据为优质多媒体数据。
[0003]目前，可先将大量的多媒体数据投放，再更改已投放的多媒体数据中的素材并重新投放。进而，通过比对用户对更改素材前的多媒体数据的行为信息以及对更改素材后的多媒体数据的行为信息来对多媒体数据中的素材进行评估。但是，当素材过多，组合量级显著增加时，投放的成本是过高。

技术实现思路

[0004]有鉴于此，本申请实施例提供一种内容检测方法、装置及设备，能够在减少投放成本的基础上，有效对目标内容数据中的素材进行归因。
[0005]为解决上述问题，本申请实施例提供的技术方案如下：
[0006]第一方面，本申请实施例提供一种内容检测方法，所述方法包括：
[0007]提取目标内容数据的内容特征向量；所述目标内容数据的内容特征向量由至少一种目标素材特征向量组成；
[0008]获取目标用户账户对应的用户特征向量；
[0009]将所述目标内容数据的内容特征向量和所述目标...

【技术保护点】

【技术特征摘要】
1.一种内容检测方法，其特征在于，所述方法包括：提取目标内容数据的内容特征向量；所述目标内容数据的内容特征向量由至少一种目标素材特征向量组成；获取目标用户账户对应的用户特征向量；将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中，获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重；所述内容检测模型用于输出所述目标用户账户针对所述目标内容数据的行为类别的预测结果；所述内容检测模型是基于内容数据的内容特征向量、用户账户的用户特征向量以及所述用户账户针对所述内容数据的行为类别标签训练得到的。2.根据权利要求1所述的方法，其特征在于，所述内容检测模型的训练过程，包括：提取内容数据的内容特征向量；所述内容数据的内容特征向量由至少一种素材特征向量组成；获取用户账户的用户特征向量；将所述内容数据的内容特征向量和所述用户账户的用户特征向量输入交叉注意力模块，获取所述交叉注意力模块输出的每种素材特征向量分别对应的权重；基于所述每种素材特征向量以及所述每种素材特征向量分别对应的权重进行加权求和，将加权求和后得到的向量确定为更新后的内容特征向量；利用所述更新后的内容特征向量、所述用户账户的用户特征向量以及所述用户账户针对所述内容数据的行为类别标签，训练内容检测模型；所述内容检测模型包括所述交叉注意力模块。3.根据权利要求1所述的方法，其特征在于，所述将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中，获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重，包括：将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中，通过所述交叉注意力模块计算所述目标用户账户的用户特征向量和第一权重的乘积，获取第一值，计算所述目标内容数据的内容特征向量和第二权重的乘积，获取第二值；由所述第一值以及所述第二值计算每种目标素材特征向量分别对应的权重，获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重。4.根据权利要求1所述的方法，其特征在于，当所述目标内容数据的数量为多组、所述目标用户账户包括多个子用户账户且所述目标内容数据的数量和所述子用户账户的数量相同时，所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重为多个，所述获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重，包括：将所述目标素材特征向量对应的多个权重的平均值确定为所述目标素材特征向量对应的权重，以获取所述交叉注意力模块输出的每种目标素材特征向量分别对应的权重。5.根据权利要求1所述的方法，其特征在于，在所述提取目标内容数据的内容特征向量之后，所述将所述目标内容数据的内容特征向量和所述目标用户账户的用户特征向量输入内容检测模型的交叉注意力模块中之前，所述方法还包括：将所述目标素材特征向量输入对应的降维模型中，以获取降维后的目标素材特征向
量；所述降维模型是根据降维前的历史素材特征向量和降维后的历史素材特征向量进行训练得到的；由所述降维后的目标素材特征向量重新组成所述目标内容数据的内容特征向量。6.根据权利要求5所述的方法，其特征在于，所述方法还包括：将目标内容数据标识以及所述降维后的目标素材特征向量按照键值对存储结构进行存储。7.根据权利要求1所述的方法，其特征在于，所述提取目标内容...

【专利技术属性】
技术研发人员：余席宇，余俊，周文，卢靓妮，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人