The invention discloses a method and a device for detecting multimedia data, belonging to the technical field of internet. Method includes: obtaining multimedia data to be detected; the first classification model to perform sensitive data detection processing of multimedia data based on multimedia data obtained for the first probability sensitive sensitive data; if the first sensitive probability is greater than the first predetermined threshold is based on the second classification model is greater than the first depth classification model and classification model of the first cascade, execution sensitive data detection and processing of multimedia data, multimedia data obtained for second probability sensitive sensitive data; if second sensitive probability is greater than second preset threshold, it is determined the multimedia data for sensitive data. Take the classification of two models of different depth of multimedia data detection, can take into account the time performance and detection effect, so that through the two cascade classification model can meet the needs of online real-time detection, but also can guarantee the detection accuracy.
【技术实现步骤摘要】
多媒体数据检测方法及装置
本专利技术涉及互联网
,特别涉及一种多媒体数据检测方法及装置。
技术介绍
随着互联网技术的快速发展,诸如图片、文字、声音、视频等多媒体数据通过互联网传播到了世界的各个角落。一方面,上述多媒体数据的传播为人们的学习、工作和生活提供了巨大的帮助。另一方面,出于牟取暴利或扩大影响力等目的,上述多媒体数据中也不乏包括淫秽色情、政治敏感、暴力恐怖等内容的敏感数据。由于这些敏感数据的传播会严重影响人们的身心健康,因此为了净化网络,如何进行多媒体数据检测成为了本领域一个亟待解决的问题。以多媒体数据为图片为例,相关技术在进行图片检测之前,首先还需进行模型训练。其中,模型训练过程为:将人工收集并标注的一定数量正常图片(即非敏感图片)和敏感图片作为训练样本集,之后根据该训练样本集对选取的一个分类模型进行训练,得到训练后的分类模型。这样在进行图片检测时,便可直接基于这个训练后的分类模型对待检测的图片执行敏感图片检测处理,得到该图片为敏感图片的敏感概率;若上述敏感概率超过预设阈值,则确定待检测的图片为敏感图片。在实现本专利技术的过程中,专利技术人发现相关技术至少存在以下问题:继续以多媒体数据为图片为例,由于采取单一分类模型进行图片检测,且时间性能与检测效果是一对相互矛盾的因素,即当检测效果较好时由于对多媒体数据的检测足够精细那么检测所消耗的时间便会较长,而当检测所消耗的时间较短时由于对多媒体数据的检测不够精细那么检测效果便会较差,因此无法兼顾时间性能与检测效果。比如,若上述分类模型的时间性能较好,如检测一张图片大概仅需100ms左右,则检测效果便会 ...
【技术保护点】
一种多媒体数据检测方法,其特征在于,所述方法包括:获取待检测的多媒体数据;基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率;若所述第一敏感概率大于第一预设阈值,则基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为所述敏感数据的第二敏感概率;若所述第二敏感概率大于第二预设阈值,则确定所述多媒体数据为所述敏感数据。
【技术特征摘要】
1.一种多媒体数据检测方法,其特征在于,所述方法包括:获取待检测的多媒体数据;基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率;若所述第一敏感概率大于第一预设阈值,则基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为所述敏感数据的第二敏感概率;若所述第二敏感概率大于第二预设阈值,则确定所述多媒体数据为所述敏感数据。2.根据权利要求1所述的方法,其特征在于,所述第一分类模型包括第一数目个卷积核结构,每一个卷积核结构顺次相连,每一个卷积核结构中均包括第一卷积核和第二卷积核,所述第一卷积核与所述第二卷积核的尺寸不同;所述基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率,包括:对于所述第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第一中间特征矩阵;基于所述当前卷积核结构的第一卷积核,对所述第一中间特征矩阵进行卷积处理,得到第一特征矩阵;基于所述当前卷积核结构的第二卷积核,对所述第一中间特征矩阵进行卷积处理,得到第二特征矩阵;将所述第一特征矩阵和所述第二特征矩阵进行组合处理,得到第二中间特征矩阵,将所述第二中间特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;根据所述第一目标特征矩阵,计算所述第一敏感概率;其中,若所述当前卷积核结构为所述第一分类模型的首个卷积核结构,则所述第一中间特征矩阵为所述多媒体数据的原始特征矩阵。3.根据权利要求1所述的方法,其特征在于,所述第一分类模型包括第一数目个卷积核结构,每一个卷积核结构顺次相连,每一个卷积核结构中包括至少一个第三卷积核;所述基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率,包括:对于所述第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三特征矩阵;基于所述当前卷积核结构的至少一个第三卷积核,对所述第三特征矩阵中至少一个特征矩阵进行卷积处理,得到第四特征矩阵;将所述第四特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;根据所述第一目标特征矩阵,计算所述第一敏感概率;其中,若所述当前卷积核结构为所述第一分类模型的首个卷积核结构,则所述第三特征矩阵为所述多媒体数据的原始特征矩阵。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述第一目标特征矩阵,计算所述第一敏感概率,包括:基于所述第一目标特征矩阵,计算所述多媒体数据的第一特征向量;获取所述第一分类模型的第一分类矩阵,所述第一分类矩阵的行数与所述第一特征向量的列数相等,所述第一分类矩阵的列数与所述第一分类模型的分类类别的数目相等;将所述第一特征向量与所述第一分类矩阵进行乘积运算,得到所述第一敏感概率。5.根据权利要求1所述的方法,其特征在于,所述第二分类模型包括第二数目个卷积核结构,所述第二数目大于第一数目,每一个卷积核结构顺次相连,每一个卷积核结构中均包括第四卷积核和第五卷积核,所述第四卷积核与所述第五卷积核的尺寸不同,所述第四卷积核和所述第五卷积核的尺寸均大于第一卷积核、第二卷积核和第三卷积核的尺寸;所述基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,包括:对于所述第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三中间特征矩阵;基于所述当前卷积核结构的第四卷积核,对所述第三中间特征矩阵进行卷积处理,得到第五特征矩阵;基于所述当前卷积核结构的第五卷积核,对所述第三中间特征矩阵进行卷积处理,得到第六特征矩阵;将所述第五特征矩阵和所述第六特征矩阵进行组合处理,将得到的第四中间特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;根据所述第二目标特征矩阵,计算所述第二敏感概率;其中,若所述当前卷积核结构为所述第二分类模型的首个卷积核结构,则所述第二中间特征矩阵为所述多媒体数据的原始特征矩阵。6.根据权利要求1所述的方法,其特征在于,所述第二分类模型包括第二数目个卷积核结构,所述第二数目大于第一数目;每一个卷积核结构顺次相连,每一个卷积核结构中包括至少一个第六卷积核,所述第六卷积核的尺寸大于第一卷积核、第二卷积核和第三卷积核的尺寸;所述基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为所述敏感数据的第二敏感概率,包括:对于所述第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第七特征矩阵;基于所述当前卷积核结构的至少一个第六卷积核,对所述第七特征矩阵中至少一个特征矩阵进行卷积处理,得到第八特征矩阵;将所述第八特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;根据所述第二目标特征矩阵,计算所述第二敏感概率;其中,若所述当前卷积核结构为所述第二分类模型的首个卷积核结构,则所述第七特征矩阵为所述多媒体数据的原始特征矩阵。7.根据权利要求5或6所述的方法,其特征在于,所述根据所述第二目标特征矩阵,计算所述第二敏感概率,包括:基于所述第二目标特征矩阵,计算所述多媒体数据的第二特征向量;获取所述第二分类模型的第二分类矩阵,所述第二分类矩阵的行数与所述第二特征向量的列数相等,所述第二分类矩阵的列数与所述第二分类模型的分类类别的数目相等;将所述第二特征向量与所述第二分类矩阵进行乘积运算,得到所述第二敏感概率。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述第二敏感概率大于第三预设阈值且小于所述第二预设阈值,则获取人工对所述多媒...
【专利技术属性】
技术研发人员:胡易,余宗桥,郭晓威,
申请(专利权)人:腾讯科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。