异常多媒体资源识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38458520 阅读:23 留言:0更新日期:2023-08-11 14:35
本公开关于一种异常多媒体资源识别方法、装置、电子设备及存储介质,所述方法包括:确定待识别多媒体资源中的目标文本以及目标图像;将目标文本输入文本特征提取模型进行文本特征提取处理,得到目标文本特征;将目标图像输入图像特征提取模型进行图像特征提取处理,得到目标图像特征;对目标文本特征以及目标图像特征进行融合处理,得到目标融合特征;获取异常类簇集;异常类簇集为根据多个异常多媒体资源各自对应的异常类别,对多个异常多媒体资源各自对应的预设融合特征进行聚类得到;基于目标融合特征与异常类簇集中各个异常类簇的匹配结果,确定待识别多媒体资源的识别结果;本公开提高了异常多媒体资源的识别准确率。公开提高了异常多媒体资源的识别准确率。公开提高了异常多媒体资源的识别准确率。

【技术实现步骤摘要】
异常多媒体资源识别方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,尤其涉及一种异常多媒体资源识别方法、装置、电子设备及存储介质。

技术介绍

[0002]应用平台中通常存在大量的多媒体资源,包括正面信息和负面的异常多媒体资源,而异常多媒体资源会对用户造成错误的引导;因此,需要从大量多媒体资源中筛选出异常多媒体资源。
[0003]相关技术中,在从多媒体资源中筛选异常多媒体资源的过程中,通常采用单模态特征(文本特征)进行分类判断,而单模态特征的表征能力较差,误差较大,从而造成异常多媒体资源的识别准确率较低。

技术实现思路

[0004]本公开提供一种异常多媒体资源识别方法、装置、电子设备及存储介质,以至少解决相关技术中异常多媒体资源的识别准确率较低的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种异常多媒体资源识别方法,包括:
[0006]确定待识别多媒体资源中的目标文本以及目标图像;
[0007]将所述目标文本输入文本特征提取模型进行文本特征提取处理,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种异常多媒体资源识别方法,其特征在于,包括:确定待识别多媒体资源中的目标文本以及目标图像;将所述目标文本输入文本特征提取模型进行文本特征提取处理,得到目标文本特征;将所述目标图像输入图像特征提取模型进行图像特征提取处理,得到目标图像特征;对所述目标文本特征以及所述目标图像特征进行融合处理,得到目标融合特征;获取异常类簇集;所述异常类簇集为根据多个异常多媒体资源各自对应的异常类别,对所述多个异常多媒体资源各自对应的预设融合特征进行聚类得到,所述异常类簇集包括至少一个异常类簇;每个异常类簇对应的特征集包括至少一个预设融合特征;每个异常类簇对应一个异常类别;基于所述目标融合特征与所述异常类簇集中各个异常类簇的匹配结果,确定所述待识别多媒体资源的识别结果;所述识别结果表征所述待识别多媒体资源是否异常。2.根据权利要求1所述的方法,其特征在于,所述文本特征提取模型的训练方法包括:将训练文本输入第一预设模型,所述第一预设模型包括多个神经网络;基于第一数量的神经网络对所述训练文本进行文本特征提取,得到第一文本特征;基于第二数量的神经网络对所述训练文本进行文本特征提取,得到第二文本特征;基于同一训练文本对应的第一文本特征以及第二文本特征,构建正文本特征对;基于任意两个训练文本各自对应的训练文本特征,构建负文本特征对;所述训练文本特征为所述第一文本特征或所述第二文本特征;确定所述正文本特征对中两个文本特征的第一相似度以及所述负文本特征对中两个文本特征的第二相似度;基于所述第一相似度与所述第二相似度的差值,确定第一损失信息;根据所述第一损失信息,调整所述第一预设模型的模型参数直至满足训练结束条件,将训练结束时的第一预设模型确定为初始文本特征提取模型;基于所述初始文本特征提取模型,确定所述文本特征提取模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述初始文本特征提取模型,确定所述文本特征提取模型,包括:根据样本文本集,构建样本文本对;所述样本文本对包括两种类型的文本对,所述两种类型的文本对为正样本文本对和负样本文本对;所述正样本文本对中两个文本的相似度大于第一阈值,所述负样本文本对中两个文本的相似度小于第二阈值;所述第一阈值大于所述第二阈值;将所述样本文本对中每个样本文本输入所述初始文本特征提取模型进行文本特征提取,得到每个样本文本对应的样本文本特征;确定所述正样本文本对所对应的两个样本文本特征之间的相似度,得到正样本文本相似度;确定所述负样本文本对所对应的两个样本文本特征之间的相似度,得到负样本文本相似度;基于所述正样本文本相似度与所述负样本文本相似度的差值,对所述初始文本特征提取模型进行训练,得到所述文本特征提取模型。4.根据权利要求1所述的方法,其特征在于,所述图像特征提取模型的训练方法包括:
根据样本图像集,构建样本图像对;所述样本图像对包括两种类型的图像对,所述两种类型的图像文本对为正样本图像对以及负样本图像对,所述正样本图像对中两个图像的相似度大于第三阈值,所述负样本图像对中两个图像的相似度小于第四阈值;所述第三阈值大于所述第四阈值;将所述样本图像对中每个样本图像输入第二预设模型进行图像特征提取处理,得到每个样本图像对应的样本图像特征;确定所述正样本图像对所对应的两个样本图像特征之间的相似度,得到正样本图像相似度;确定所述负样本图像对所对应的两个样本图像特征之间的相似度,得到负样本图像相似度;基于所述正样本图像相似度与所述负样本图像相似度的差值,对所述第二预设模型进...

【专利技术属性】
技术研发人员:张恒肖克聪
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1