【技术实现步骤摘要】
内容检测方法和系统
[0001]本说明书涉及图像识别领域,尤其涉及一种内容检测方法和系统。
技术介绍
[0002]近年来,随着互联网技术的飞速发展,内容生成的方式越来越便捷,比如,可以采用人工智能技术(AI)基于输入的文本生成具有特定艺术风格的内容图像或视频等。针对这类通过AI技术生成的图像或视频内容,而这一类的伪造内容并不能申请版权,因此,在内容安全环节,需要对这些内容进行内容检测。现有的内容检测方法往往通过基于原始图像的伪造内容检测方法或者基于相机水印的伪造内容检测方法。
[0003]在对现有技术的研究和实践过程中,本申请的专利技术人发现基于原始图像的伪造内容检测方法需要通过大量的标注数据进行模型训练,对于在伪造内容样本数量有限的情况下,大大限制了伪造内容检测的检测能力,而基于相机水印的方式需要在采集阶段引入额外的水印,使得内容检测的覆盖率较低,难以应用到所有的场景,因此,导致内容检测的检测性能较低。
技术实现思路
[0004]本说明书提供一种检测性能更高的内容检测方法和系统。
[0005 ...
【技术保护点】
【技术特征摘要】
1.一种内容检测方法,包括:获取目标内容的至少一张内容图像;将所述至少一张内容图像输入至内容检测模型,以得到所述目标内容的伪造内容概率和所述伪造内容概率对应的至少一个伪造内容特征,所述内容检测模型的训练样本包括基于多专家模型组对参考内容进行扩散后生成的多个伪造内容样本,所述多专家模型组包括多个互补的图文匹配模型;以及基于所述伪造内容概率和所述至少一个伪造内容特征,确定所述目标内容的风险检测结果,并输出所述风险检测结果。2.根据权利要求1所述的内容检测方法,其中,所述目标内容包括图像内容或视频内容中的至少一种。3.根据权利要求1所述的内容检测方法,其中,所述多专家模型组的训练过程包括以下步骤:获取内容样本对,并将所述内容样本对输入至预设多模型组,以得到所述内容样本对对应的特征集合和特征相似度集合;以及基于所述特征集合和所述特征相似度集合,对所述预设多模型组进行收敛,得到训练后的所述多专家模型组。4.根据权利要求3所述的内容检测方法,其中,所述内容样本对包括图像样本和文本样本,所述预设多模型组包括多个预设图文匹配模型和特征迁移网络;以及所述将所述内容样本对输入至预设多模型组,以得到所述内容样本对对应的特征集合和特征相似度集合,包括:将所述内容样本对分别输入至所述多个预设图文匹配模型,得到样本特征集合和特征相似度集合,所述样本特征集合包括所述多个预设图文匹配模型中每一预设图文匹配模型输出的所述图像样本的样本图像特征和所述文本样本的样本文本特征,所述特征相似度集合包括所述每一预设图文匹配模型输出的所述样本图像特征与所述样本文本特征之间的特征相似度,将所述样本特征集合中的每一样本特征输入至所述特征迁移网络,以得到迁移特征集合,所述迁移特征集合包括将所述多个预设图文匹配模型中任意一个预设图文匹配模型对应的样本特征迁移至所述多个预设图文匹配模型中其他预设图文匹配模型对应的样本特征,以及将所述迁移特征集合和所述样本特征集合作为所述特征集合。5.根据权利要求4所述的内容检测方法,其中,所述对所述预设多模型组进行收敛,得到训练后的所述多专家模型组,包括:获取所述内容样本对的标注匹配结果,并基于所述标注匹配结果、所述特征相似度集合和所述样本特征集合,确定特征匹配损失信息;基于所述样本特征集合,确定所述多个预设图文匹配模型之间的特征互补损失信息;基于所述样本特征集合和所述迁移特征集合,确定特征迁移损失信息;以及基于所述特征匹配损失信息、特征互补损失信息和所述特征迁移损失信息,对所述预设多模型组进行收敛,得到所述多专家模型组。6.根据权利要求5所述的内容检测方法,其中,所述基于所述标注匹配结果、所述特征
相似度集合和所述样本特征集合,确定特征匹配损失信息,包括:基于所述标注匹配结果,确定所述内容样本对对应的第一预设相似度阈值;在所述特征相似度集合中选取出所述每一预设图文匹配模型对应的目标特征相似度,并将所述目标特征相似度与所述第一预设相似度阈值进行对比,以得到所述每一预设图文匹配模型对应的第一特征匹配损失信息;基于所述样本特征集合和所述第一预设相似度阈值,确定所述预设多模型组对应的第二特征匹配损失信息;以及将所述第一特征匹配损失信息和所述第二特征匹配损失信息作为所述特征匹配损失信息。7.根据去哪里要求6所述的内容检测方法,其中,所述基于所述样本特征集合和所述第一预设相似度阈值,确定所述预设多模型组对应的第二特征匹配损失信息,包括:在所述样本特征集合中选取出所述样本图像特征,得到样本图像特征集合,并在所述样本特征集合中选取出所述样本文本特征,得到样本文本特征集合;将所述样本图像特征集合中的样本图像特征进行累加,得到目标样本图像特征,并将所述样本文本特征集合中的样本文本特征进行累加,得到目标样本文本特征;以及获取所述目标样本图像特征与所述目标样本文本特征之间的当前特征相似度,并将所述当前特征相似度与所述第一预设相似度阈值进行对比,以得到所述第二特征匹配损失信息。8.根据权利要求5所述的内容检测方法,其中,所述基于所述样本特征集合,确定所述多个预设图文匹配模型之间的特征互补损失信息,包括:在所述样本特征集合中选取出不同所述图文匹配模型输出的同类型的样本特征,得到至少一个样本特征对;获取所述至少一个样本特征对中每一样本特征对中的特征之间的特征相似度,得到互补的特征相似度集合;以及将所述互补的特征相似度集合中的特征相似度与第二预设相似度阈值进行对比,以得到所述特征互补损失信息,所述特征互补损失信息的约束条件为约束不同所述图文匹配模型输出的同类型的样本特征之间的特征相似度小于所述第二预设相似度阈值。9.根据权利要求5所述的内容检测方法,其中,所述基于所述样本特征集合和所述迁移特征集合,确定特征迁移损失信息,包括:在所述样本特征集合中选取出所述迁移特征集合中每一迁移特征对应的候选样本特征;获取所述候选样本特征与对应的所述迁移特征之间的特征相似度,得到迁移特征相似度集合;以及将所述迁移特征相似度集合中的特征相似度与第三预设相似度阈值进行对比,以得到所述特征迁移损失信息,所述特征迁移损失信息的约束条件为约束不同预设图文匹配模型的样本特征之间迁移时的特征相似度小于所述第三预设相似度阈值。10.根据权利要求1所述的内容检测方法,其中,所述内容检测模型的训练过程包括以下步骤:获取所述训练样本中目标内容样本对应的内容图像样本对;
将所述内容图像样本对输入至预设内容检测模型,以得到样本伪造内容特征和预测内容类别;以及基于所述样本伪造内容特征和所述预测内容类别,对所述预设内容检测模型进行收敛,得到训练后的所述内容检测模型。11.根据权利要求10所述的内容检测方法,其中,所述将所述内容图像样本对输入至预设内容检测模型,以得到样本伪造内容特征和预测内容类别,包括:对所述内容图像样本对中的内容图像样本进行线性叠加,得到混合内容图像样本;分别对所述内容图像样本对和所述混合内容图像样本进行特征提取,得到候选样本图像特征集合;以及在所述候选样本图像特征集合中提取出所述样本伪造内容特征,并基于所述样本伪造内容特征,确定所述目标内容样本的预测内容类别。12.根据权利要求11所述的内容检测方法,其中,所述在所述候选样本图像特征集合中提取出所述样本伪造内容特征,包括:对所述候选样本图像特征集合中的样本图像特征进行线性叠加,得到混合样本图像特征;分别在所述候选样本图像特征集合和所述混合样本图像特征中...
【专利技术属性】
技术研发人员:曹佳炯,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。