基于人工智能的多媒体资源检测方法、装置、设备及介质制造方法及图纸

技术编号:24208511 阅读:39 留言:0更新日期:2020-05-20 15:45
本申请提供了一种基于人工智能的多媒体资源检测方法、装置、设备及介质,属于人工智能技术领域。方法包括:从目标多媒体资源中获取至少一个待检测图像;对于任一待检测图像,获取待检测图像对应的至少一个目标子图像;基于卷积神经网络对待检测图像和至少一个目标子图像进行处理,得到至少一个目标人脸框;基于至少一个目标人脸框确定至少一个目标人体框;调用检测模型对至少一个目标人体框所指示的至少一个人体图像进行处理,以得到至少一个人体图像的至少一个预测概率;基于至少一个预测概率,确定目标多媒体资源是否包括限制性内容。上述技术方案,可以使得检测结果不会受到图像背景的影响,对多媒体资源检测的准确率较高。

Method, device, equipment and medium of multimedia resource detection based on Artificial Intelligence

【技术实现步骤摘要】
基于人工智能的多媒体资源检测方法、装置、设备及介质
本申请涉及人工智能
,特别涉及一种基于人工智能的多媒体资源检测方法、装置、设备及介质。
技术介绍
随着互联网技术的发展,用户可以通过互联网浏览多媒体资源,如图片、视频等。然而,目前存在不法分子利用互联网传播包含限制性内容的多媒体资源的现象,如包含不良内容的图片或者视频等。由于传播包含限制性内容的多媒体资源属于违法行为,严重扰乱了互联网秩序,污染了互联网环境。因此,需要对用户上传的多媒体资源进行检测,防止包含限制性内容的多媒体资源的传播。相关技术中,对多媒体资源检测的方式通常是将用户上传的多媒体资源,如图片或者视频帧图像等,输入检测模型中,根据该检测模型的输出结果来确定该多媒体资源是否含有限制性内容。上述技术方案中,检测模型在对图片或者视频帧图像进行检测时,会受到图片或者视频帧图像背景的干扰,使得检测模型对图片或者视频帧图像的识别效果较差,导致对多媒体资源检测的准确率低。
技术实现思路
本申请实施例提供了一种基于人工智能的多媒体资源检测方法、装置本文档来自技高网...

【技术保护点】
1.一种基于人工智能的多媒体资源检测方法,其特征在于,所述方法包括:/n从目标多媒体资源中获取至少一个待检测图像;/n对于任一待检测图像,获取所述待检测图像对应的至少一个目标子图像,所述目标子图像由所述待检测图像缩放到不同分辨率得到;/n基于卷积神经网络对所述待检测图像和所述至少一个目标子图像进行处理,得到至少一个目标人脸框,所述目标人脸框用于指示人脸在所述待检测图像中的位置;/n基于所述至少一个目标人脸框确定至少一个目标人体框,所述目标人体框用于指示人体在所述待检测图像中的位置;/n调用检测模型对所述至少一个目标人体框所指示的至少一个人体图像进行处理,以得到所述至少一个人体图像的至少一个预测...

【技术特征摘要】
1.一种基于人工智能的多媒体资源检测方法,其特征在于,所述方法包括:
从目标多媒体资源中获取至少一个待检测图像;
对于任一待检测图像,获取所述待检测图像对应的至少一个目标子图像,所述目标子图像由所述待检测图像缩放到不同分辨率得到;
基于卷积神经网络对所述待检测图像和所述至少一个目标子图像进行处理,得到至少一个目标人脸框,所述目标人脸框用于指示人脸在所述待检测图像中的位置;
基于所述至少一个目标人脸框确定至少一个目标人体框,所述目标人体框用于指示人体在所述待检测图像中的位置;
调用检测模型对所述至少一个目标人体框所指示的至少一个人体图像进行处理,以得到所述至少一个人体图像的至少一个预测概率,其中,一个预测概率用于表征一个人体图像属于限制性内容的概率;
基于所述至少一个预测概率,确定所述目标多媒体资源是否包括限制性内容。


2.根据权利要求1所述的方法,其特征在于,所述基于卷积神经网络对所述待检测图像和所述至少一个目标子图像进行处理,得到至少一个目标人脸框,包括:
基于第一卷积神经网络对所述待检测图像和所述至少一个目标子图像分别进行处理,得到至少一个第一人脸框;
根据所述至少一个第一人脸框得到至少一个目标人脸图像;
基于第二卷积神经网络对所述待检测图像和所述至少一个目标人脸图像进行处理,得到至少一个目标人脸框。


3.根据所述权利要求2所述的方法,其特征在于,所述基于第一卷积神经网络对所述待检测图像和所述至少一个目标子图像分别进行处理,得到至少一个第一人脸框,包括:
对于所述待检测图像和所述至少一个目标子图像中的任一待处理图像,基于所述第一卷积神经网络将所述待处理图像划分为至少两个图像块;
对于任一图像块,响应于所述图像块被检测为人脸的概率大于第一概率,对所述图像块进行边框回归校准,得到第二人脸框,所述边框回归校准用于将所述图像块的边框基于压缩比例转换为在所述待检测图像中的人脸框;
响应于得到的第二人脸框的数量大于一,对至少两个第二人脸框进行去重,得到至少一个第一人脸框。


4.根据权利要求3所述的方法,其特征在于,所述对所述图像块进行边框回归校准,得到第二人脸框,包括:
根据所述图像块所在的待处理图像的压缩比例和所述图像块的边框信息确定边框回归向量;
根据所述边框回归向量将所述图像块的边框信息转换为在所述待检测图像中的人脸框信息;
根据所述人脸框信息确定第二人脸框。


5.根据权利要求3所述的方法,其特征在于,所述对至少两个第二人脸框进行去重,得到至少一个第一人脸框,包括:
将所述至少两个第二人脸框存入第一候选池,所述第一候选池中的第二人脸框按照对应的图像块被检测为人脸的概率进行降序排列;
响应于所述第一候选池不为空,重复执行以下步骤:
取出所述第一候选池中当前排在首位的第二人脸框作为第一人脸框;
从所述第一候选池中删除与所述第一人脸框的重叠度大于第一重叠度阈值的第二人脸框。


6.根据权利要求2所述的方法,其特征在于,所述基于第二卷积神经网络对所述待检测图像和所述至少一个目标人脸图像进行处理,得到至少一个目标人脸框,包括:
对于任一目标人脸图像,基于所述第二卷积神经网络将所述目标人脸图像的尺寸调整到第一尺寸;
响应于调整后的目标人脸图像被检测为人脸的概率大于第二概率,对所述调整后的目标人脸图像进行边框回归校准,得到第三人脸框,所述边框回归校准用于将所述调整后的目标人脸图像的边框转换为在所述待检测图像中的人脸框;
响应于得到的第三人脸框的数量大于一,对至少两个第三人脸框进行去重,得到至少一个目标人脸框。


7.根据权利要求6所述的方法,其特征在于,所述对至少两个第三人脸框进行去重,得到至少一个目标人脸框,包括:
将所述至少两个第三人脸框存入第二候选池,所述第二候选池中的第三人脸框按照对应的目标人脸图像被检测为人脸的概率进行降序排列;
响应于所述第...

【专利技术属性】
技术研发人员:郭梓铿
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1