内容审核、内容审核模型的训练方法及相关装置制造方法及图纸

技术编号：36206323 阅读：11 留言：0更新日期：2023-01-04 12:01

本申请公开了一种内容审核、内容审核模型的训练方法及相关装置，该内容审核方法包括：加载预设的内容审核模型，内容审核模型包括图像编码器、图像适配器、文本编码器与文本适配器；将待内容审核的图像数据输入图像编码器中提取第一图像特征；将第一图像特征输入图像适配器中映射至目标空间、得到第二图像特征；将表征内容审核中类别的文本信息输入文本编码器中提取第一文本特征；将第一文本特征输入文本适配器中映射至目标空间、得到第二文本特征；将第二图像特征与第二文本特征进行比较，以对图像数据生成审核结果。本实施例中使用多模态进行内容审核，迭代更新内容审核模型的样本量大大降低，扩展性强，提高了内容审核的响应速度。应速度。应速度。

全部详细技术资料下载

【技术实现步骤摘要】
内容审核、内容审核模型的训练方法及相关装置

[0001]本申请涉及内容审核的
，尤其涉及一种内容审核、内容审核模型的训练方法及相关装置。

技术介绍

[0002]随着互联网的技术发展，各种视觉内的内容应用于各个互联网产品中，如直播、短视频等，针对视觉类的内容审核是否符合规范是互联网产品中的一部分，有利于建设良好的产品生态环境，视觉类的内容审核系统能够减少内容审核的人力成本、减少违规内容的曝光频率。
[0003]目前，视觉类的内容审核主要是基于图像单模态的神经网络，针对特定的类别，收集大量违规的图像数据(正样本)与非违规的图像数据(负样本)训练神经网络进行分类。
[0004]但是，基于图像单模态的神经网络调整难度较大，如果审核的规则发生变化，则要求对训练的图像数据重新清洗、迭代周期长；并且，基于图像单模态的神经网络扩展性较低，新增类别要重新收集大量违规的图像数据，重训迭代神经网络，代价较高。

技术实现思路

[0005]本申请提供了一种内容审核、内容审核模型的训练方法及相关装置，以解决视觉类的内容审核调整难度较大、扩展性较低的问题。
[0006]根据本申请的一方面，提供了一种内容审核方法，包括：
[0007]加载预设的内容审核模型，所述内容审核模型包括图像编码器、图像适配器、文本编码器与文本适配器；
[0008]将待内容审核的图像数据输入所述图像编码器中提取第一图像特征；
[0009]将所述第一图像特征输入所述图像适配器中映射至目标空间、得到第二图像特征...

【技术保护点】

【技术特征摘要】
1.一种内容审核方法，其特征在于，包括：加载预设的内容审核模型，所述内容审核模型包括图像编码器、图像适配器、文本编码器与文本适配器；将待内容审核的图像数据输入所述图像编码器中提取第一图像特征；将所述第一图像特征输入所述图像适配器中映射至目标空间、得到第二图像特征；将表征内容审核中类别的文本信息输入所述文本编码器中提取第一文本特征；将所述第一文本特征输入所述文本适配器中映射至所述目标空间、得到第二文本特征；将所述第二图像特征与所述第二文本特征进行比较，以对所述图像数据生成审核结果。2.根据权利要求1所述的方法，其特征在于，所述将所述第二图像特征与所述第二文本特征进行比较，以对所述图像数据生成审核结果，包括：计算所述第二图像特征与所述第二文本之间的相似度；若所述相似度大于预设的阈值，则确定所述图像数据的审核结果为所述图像数据的内容属于所述类别；若所述相似度小于或等于预设的阈值，则确定所述图像数据的审核结果为所述图像数据的内容不属于所述类别。3.一种内容审核模型的训练方法，其特征在于，包括：确定内容审核模型，所述内容审核模型包括图像编码器、图像适配器、文本编码器与文本适配器，所述图像编码器用于从图像数据中提取第一图像特征，所述图像适配器用于将所述第一图像特映射至目标空间、得到第二图像特征，所述文本编码器用于从文本信息中提取第一文本特征，所述文本适配器用于将所述第一文本特映射至所述目标空间、得到第二文本特征；以对抗与分类的方式将所述图像编码器训练至适配内容审核；若完成训练所述图像编码器，则在固定所述图像编码器、所述文本编码器的条件下，以分类的方式将所述图像适配器与所述文本适配器训练至适配内容审核。4.根据权利要求3所述的方法，其特征在于，所述以对抗与分类的方式将所述图像编码器训练至适配内容审核，包括：确定分类支路、对抗支路，所述分类支路用于训练所述图像编码器，以使所述第一图像特征适用于划分内容审核中的各个类别，所述对抗支路用于以对抗的方式训练所述图像编码器，以使所述第一图像特征区分适用于内容审核；在每次迭代训练中，依次更新所述分类支路与所述对抗支路，以将所述图像编码器训练至适配内容审核。5.根据权利要求4所述的方法，其特征在于，所述对抗支路中具有所述图像编码器、适配非特定操作的通用编码器与判别器，所述分类支路中具有所述图像编码器与前馈网络；所述在每次迭代训练中，依次更新所述分类支路与所述对抗支路，以将所述图像编码器训练至适配内容审核，包括：将作为样本的图像数据分别输入所述图像编码器中提取第一图像特征、输入所述通用编码器中提取第三图像特征；
在所述判别器中使用所述第一图像特征对所述图像数据生成是否适配内容审核的第一对抗标签、使用所述第三图像特征对所述图像数据生成是否适配内容审核的第二对抗标签；在所述前馈网络中将所述第一图像特映射至分类空间、得到第四图像特征；将所述第四图像特映射为所述图像数据属于各个适配内容审核的类别的概率；根据所述第一对抗标签与所述概率更新所述图像编码器的参数与所述前馈网络的参数；在维持所述图像编码器的参数不变的条件下，根据所述第一对抗标签与所述第二对抗标签更新所述判别器的参数；判断是否满足预设的第一训练条件；若是，则确定所述图像编码器完成训练，若否，则返回执行所述将作为样本的图像数据分别输入所述图像编码器中提取第一图像特征、输入适配非特定操作的通用编码器中提取第三图像特征。6.根据权利要求5所述的方法，其特征在于，所述根据所述第一对抗标签与所述概率对更新所述图像编码器的参数与所述前馈网络的参数，包括：基于所述概率生成分类标签，所述分类标签表示所述图像数据是否属于所述类别；对1减去所述第一对抗标签得到的差值取平方，得到第一候选值；将各个所述分类标签与所述概率的导数之间的乘积求和，得到第二候选值；将所述第一候选值与所述第二候选值的负数线性融合为第一损失值；按照所述第一损失值更新所述图像编码器的参数与所述前馈网络的参数。7.根据权利要求5所述的方法，其特征在于，所述在维持所述图像编码器的参数不变的条件下，根据所述第一对抗标签与所述第二对抗标签更新所述判别器的参数，包括：对所述第一对抗标签取平方，得到第三候选值；对1减去所述第二对抗标签得到的差值取平方，得到第四候选值；将所述第三候选值与所述第四候选值线性融合为第二损失值；在维持所述图像编码器的参数不变的条件下，按照所述第二损失值更新所述前馈网络的参数。8.根据权利要求3
‑
7中任一项所述的方法，其特征在于，所述在固定所述图像编码器、所述文本编码器的条件下，以分类的方式将所述图像适配器与所述文本适配器训练至适配内容审核，包括：将作为样本的图像数据输入所述图像编码器中提取第一图像特征；将所述第一图像特征输入所述图像适配器中映射至目标空间、得到第二图像特征；将作为样本的文本信息输入所述文本编码器中提取第一文本特征；将所述第一文本特征输入所述文本适配器中映射至所述目标空...

【专利技术属性】
技术研发人员：陈德健，项伟，
申请(专利权)人：广州市网星信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人