The invention discloses an image content identification method for correcting misjudgment. The method includes: 1) to expand the training sample data set, which can extract enough object recognition; 2) with the extended data set, using Faster R CNN framework for training data, introducing the industry in the process of training class and the negative, positive samples to train finally, Faster R CNN network; 3) using Faster R CNN network training, recognition to specific object detection in image processing. Step 1) the samples for tensile and noise adding extended data set, can also be used in other ways; step 2) through the false image data characteristic and deep analysis of the regularity in the process of testing, and will be easy to confuse the positive sample image is segmented into many types, forming the false negative class. The invention can significantly reduce the model miscarriage of justice and improve the accuracy of image content recognition.
【技术实现步骤摘要】
一种修正误判的图像内容识别方法
本专利技术属于计算机视觉
,具体涉及一种能够降低误判的图像内容识别方法。
技术介绍
随着互联网的飞速发展,网络中的信息分享和传播日益广泛。在给人们生活带来极大便利和新鲜资讯的同时,网络也被用于各种不良和敏感信息的传播,安全性问题日益突出。其中,多媒体数据因其生动、直观的特点收到大众推崇,尤其即拍即得的图像数据,成为网络数据中最主要的组成成分之一。调查显示,目前不少不良群体活跃于网络平台,利用其传播不良思想,散播相关图像和音、视频,网络已成为这些组织煽动、招募、资助或策划活动的便利工具。当今时代的网络数据量极其巨大,传统网管的人工审查方式需耗费大量的人力物力,且常常力不从心,难以达到监管需求。因此,高效准确的实现图像内容自动识别,十分重要且很有必要。总体来看,视觉特征的研究经历了三个阶段:一是基本的特征提取,即通过图像的颜色、亮度、纹理、形状及像素的空间分布等属性对图像进行描述,如颜色特征、纹理特征、局部特征等;二是特征的表达,即在基本特征提取的基础上进行统计、编码或核描述等操作,以形成更为有效的特征表示,如基于无监督学习的“词袋”模型;三是特征的学习,即对大量的输入图像通过特定的网络结构以及训练方法学习出有意义的特征表示,用于后续的分类或其它视觉任务。深度学习(DeepLearning)近几年来活跃于计算机视觉领域,成为当下人工智能领域最受追捧的方法。其基本思想是通过有监督或无监督的学习方式,组合低层特征形成更加抽象的高层表示,即堆叠多个层,每一层的输出作为下一层的输入,从而实现输入信息的分级表达和抽象。深度学习在图像 ...
【技术保护点】
一种修正误判的图像内容识别方法,其特征在于,包括以下步骤:1)对训练样本的数据集进行扩展,保证能够提取出足够识别物体的特征;2)利用扩展后的数据集,采用Faster R‑CNN框架进行数据训练,在训练过程中引入易误判负类,将其与正样本一同进行训练,最终得到Faster R‑CNN网络;3)利用训练得到的Faster R‑CNN网络,识别待检测图像中的特定物体。
【技术特征摘要】
1.一种修正误判的图像内容识别方法,其特征在于,包括以下步骤:1)对训练样本的数据集进行扩展,保证能够提取出足够识别物体的特征;2)利用扩展后的数据集,采用FasterR-CNN框架进行数据训练,在训练过程中引入易误判负类,将其与正样本一同进行训练,最终得到FasterR-CNN网络;3)利用训练得到的FasterR-CNN网络,识别待检测图像中的特定物体。2.如权利要求1所述的方法,其特征在于,步骤1)对数据集进行扩展的方法是:首先,采用插值法对样本图像在尺度上进行微小的缩放,分别保持宽度不变将长度拉伸到原来的一定倍数、保持长度不变将宽度拉伸到原来的一定倍数;然后,对样本进行加噪处理以增强其鲁棒性,分别添加高斯噪声和椒盐噪声,以进一步增大样本总量。3.如权利要求1所述的方法,其特征在于,步骤1)采用下列方式中的一种或者多种对数据集进行扩展:镜像化处理、模糊锐化处理、背景变换处理、亮度对比度调节。4.如权利要求1所述的方法,其特征在于,步骤2)通过深入分析数据自身特点和测试过程中的误判图像规律,将易与正样本混淆的图像细分为多类,形成所述易误判负类。5.如权利要求1所述的方法,其特征在于,步骤2)采用迁...
【专利技术属性】
技术研发人员:操晓春,荆丽桦,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。