基于改进词袋模型的不良图像检测方法技术

技术编号：11556836 阅读：116 留言：0更新日期：2015-06-04 15:49

本发明专利技术公开了一种基于改进词袋模型的不良图像检测方法，主要解决传统词袋模型在检测不良图像过程中颜色描述不准确、关键特征点提取不全面、特征描述复杂、局部区域描述不精确的问题。其实现步骤为：(1)提取关键特征点；(2)对关键特征点提取颜色特征和梯度特征；(3)根据颜色特征和梯度特征分别建立颜色词典和梯度词典；(4)根据先验知识计算每个特征点颜色单词的类条件概率；(5)根据类条件概率对相应的梯度单词加权，并统计加权后的梯度单词直方图，(6)利用直方图训练分类器；(7)用训练好的分类器检测不良图像。本发明专利技术提高了颜色描述信息的丰富性，避免了关键特征点的丢失，能更加精确描述图像局部区域，可用于过滤色情图像。

全部详细技术资料下载

【技术实现步骤摘要】
基于改进词袋模型的不良图像检测方法
本专利技术属于模式识别与计算机视觉的交叉领域，特别涉及结合颜色统计先验和词袋模型的不良图像检测方法，可用于过滤色情图像。
技术介绍
随着互联网及无线通信技术的发展，人们更加易于从网上获取大量的有用信息，但是淫秽、色情等不良信息也得以迅速传播。色情图像的传播干扰用户体验正常的网络信息服务，引起严重的社会问题。因此，亟需鲁棒的不良图像信息过滤技术。由于彩色不良图像中通常含有大量裸露的肤色区域或者人体敏感器官，常用的不良信息检测方法通过分析能反映这些特点的感兴趣区域来过滤不良图像，如在YCbCr空间采用高斯混合模型对肤色进行建模，通过肤色模型提取肤色区域，分析肤色区域中的低层特征来判定该区域是否包含不良信息。中科院自动化所的Hu等在文献“W.Hu,H.Zuo,O.Wu,Y.Chen,Z.ZhangandD.Suter.Recognitionofadultimages,videos,andwebpagebags.ACMTransactionsonMultimediaComputing,CommunicationsandApplications,vol.7,no.28,pp.1-24,2011.”中采用基于AdaBoost的人体敏感器官检测器，并结合肤色区域的低层特征表示来判断图像的性质，此方法的不足在于传统颜色描述方法所描述的信息不丰富。由于不良图像的定义有较强的语义特性，基于词袋模型方法因其在语义描述上的优势成为不良图像检测极具潜力的发展方向之一。常用的基于词袋模型的不良图像检测方法首先提取图像的肤色区域，然后在肤色区域提取关...
基于改进词袋模型的不良图像检测方法

【技术保护点】
一种基于改进词袋模型的不良图像检测方法，包括如下步骤：A.收集正常图像与不良图像作为训练集，并标记每幅图像的类别；用高斯差分算子对训练集中的所有图像进行关键特征点检测，将这些关键特征点组成特征点集合T；B.对集合T中的关键特征点分别利用尺度不变变换特征SIFT方法和颜色属性CA方法计算关键特征点的梯度特征向量f和颜色特征向量f'，对梯度特征向量和颜色特征向量分别进行欧式距离测度下的K‑均值聚类；并用梯度特征向量的聚类中心组成图像的梯度词典，用颜色特征向量的聚类中心组成图像的颜色词典；C.将训练集中所有图像特征点的梯度特征向量量化为梯度词典中的单词，将训练集中所有图像特征点的颜色特征向量量化为颜色词典中的单词；D.通过贝叶斯模型计算每个特征点的颜色单词的类条件概率，并与所对应特征点的梯度单词相乘，统计得到颜色先验加权后的梯度单词直方图；E.将训练图像的加权直方图及其类别标记输入支持向量机SVM，训练不良图像分类器；F.对待测图像，根据步骤A‑C得到其关键特征点的梯度特征向量和颜色特征向量，并将这些特征向量分别量化为梯度单词和颜色单词，将步骤D得到的颜色单词的类条件概率与梯度单词相乘，统计...

【技术特征摘要】
1.一种基于改进词袋模型的不良图像检测方法，包括如下步骤：A.收集正常图像与不良图像作为训练集，并标记每幅图像的类别；用高斯差分算子对训练集中的所有图像进行关键特征点检测，将这些关键特征点组成特征点集合T；B.对集合T中的关键特征点分别利用尺度不变变换特征SIFT方法和颜色属性CA方法计算关键特征点的梯度特征向量f和颜色特征向量f'，对梯度特征向量和颜色特征向量分别进行欧式距离测度下的K-均值聚类；并用梯度特征向量的聚类中心组成图像的梯度词典，用颜色特征向量的聚类中心组成图像的颜色词典；C.将训练集中所有图像特征点的梯度特征向量量化为梯度词典中的单词，将训练集中所有图像特征点的颜色特征向量量化为颜色词典中的单词；D.通过贝叶斯模型计算每个特征点的颜色单词的类条件概率，并与所对应特征点的梯度单词相乘，统计得到颜色先验加权后的梯度单词直方图；按如下步骤进行：D1.在训练集中统计每个颜色单词wc在不良图像中出现的频次m1和每个颜色单词在正常图像中出现的频次m2，根据训练集类别标记将训练图像分为不良类和正常类，定义class为训练图像的类别，训练图像为不良图像时class＝1，训练图像为正常图像时class＝2，计算wc在不良类和正常类出现的概率为：D2.根据类别先验概率和相似度概率，通过贝叶斯准则计算颜色单词wc的类条件概率p(class＝k|wc)，贝叶斯公式如下：其中，p(class＝k)表示类别先验概率；D3.将图像中每个关键特征点的梯度单词wg乘上该关键特征点所对应的颜色单词wc的类条件概率p(class＝k|wc)，得到颜色先验加权后的梯度单词；D4.将上述加权后的梯度单词与词典中单词进行对比，统计词典中每个单词在图像所有关键特征点中出现的次数，得到每幅图像颜色先验加权后的梯度单词的直方图；E.将训练图像的加权直方图及其类别标记输入支持向量机SVM，训练不良图像分类器；F.对待测图像，根据步骤A-C得到其关键特征点的梯度特征向量和颜色特征向量，并将这些特征向量分别量化为梯度单词和颜色单词，将步骤D得到的颜色单词的类条件概率与梯度单词相乘，统计出待测图像的颜色先验加权后的梯度单词直方图；G.将待...

【专利技术属性】
技术研发人员：田春娜，张相南，高新波，王代富，王秀美，王颖，邓成，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人