一种图像处理方法及装置制造方法及图纸

技术编号:14130670 阅读:37 留言:0更新日期:2016-12-09 19:16
本发明专利技术公开了一种图像处理方法,所述方法包括:利用预设的图片分类模型对待处理图像进行分类,得到分类结果;其中,所述图片分类模型是利用支持向量机法对分类图片库中的图片进行训练而得到的,所述分类结果表明所述待处理图像所属的分类图片库;按照所述分类结果从所述待处理图像所属的分类图片库获取作为对比图像的第一图像,所述第一图像为所述待处理图像所属的分类图片库中的一张图像;计算所述待处理图像与所述对比图像之间的哈希距离;根据所述哈希距离将所述待处理图像进行去除或保留。本发明专利技术同时还公开了一种图像处理装置。

【技术实现步骤摘要】

本专利技术涉及图像处理技术,尤其涉及一种图像处理方法及装置
技术介绍
随着互联网业务的迅速发展,以及第四代(4G)通讯技术的快速普及,人们从网络获得的信息量越来越大,图片的传播量也日益增长。于此同时,各种违规图片的传播也严重干扰人们、尤其是未成年人的正常生活与身心健康,影响社会的运行秩序,造成不良的社会影响、带来负能量,同时危害到运营商的企业形象。为此,我们需要采取手段,对违规图片进行分类、识别,过滤,创造更加绿色、健康的互联网环境。现有的图片过滤技术主要是直接对色情图片进行识别。例如肤色人脸识别,可通过图片分割找出身体与脸部区域,再通过区域占比的方式来判断图片是否涉黄。或者,根据纹理特征点分析,分析出纹理特征点再通过分类判断。此外比较简单的方法还有直接通过图像的文字标签来判断图像是否违规。现有色情图片过滤技术有比较好的判断准确率,一般可以达到90%,但同样会带来一定的误判率,误判率在10%左右。而真实的情况是违规的图片占总的图片的5%,所以假设图片库中一共有10000张的网络图片,那么违规图片大约有500张,而正常图片约有9500张。如果使用现有的图片过滤技术,大约可以过滤出违规图片1450张,其中,正常图片被误判为违规图片的大约有950张。过滤后违规图片占比仅32%,误判情况相当严重,因此还需要对过滤的图片进行后续处理。从上面可以看出,现有图片过滤技术误判率比较大,经过过滤后仍有大量图片需要人工判定,造成人力资源的浪费,并且大量混杂图片也影响人工判断准确性。
技术实现思路
有鉴于此,本专利技术实施例为解决现有技术中存在的至少一个问题而提供一种图像处理方法及装置,具有图像分类针对性强、更加准确,图像匹配效率高,查全率高误判率低的技术优点。本专利技术实施例的技术方案是这样实现的:第一方面,本专利技术实施例提供一种图像处理方法,所述方法包括:利用预设的图片分类模型对待处理图像进行分类,得到分类结果;其中,所述图片分类模型是利用支持向量机法对分类图片库中的图片进行训练而得到的,所述分类结果表明所述待处理图像所属的分类图片库;按照所述分类结果从所述待处理图像所属的分类图片库获取作为对比图像的第一图像,所述第一图像为所述待处理图像所属的分类图片库中的一张图像;计算所述待处理图像与所述对比图像之间的哈希距离;根据所述哈希距离将所述待处理图像进行去除或保留。在本专利技术的一种实施例中,所述图片分类模型采用方式形成:对初步过滤后的图片进行筛选,得到初级训练库;对所述初级训练库中的图片进行分类,得到初步分类图片库;对初步分类图片库中的每张图片进行仿射变换,得到作为标准分类的分类图片库;利用支持向量机法对所述分类图片库中的图片进行训练,得到图片分类模型。在本专利技术的一种实施例中,所述利用支持向量机法对分类图片库中的图片进行训练,得到图片分类模型,包括:将所有的所述分类图片库中图片统一为一个颜色模型;对采用统一颜色模型表示的每一所述分类图片库中的图片进行量化;采用支持向量机法对所述分类图片库中不同类别图片进行两两模拟,得到图片分类模型。在本专利技术的一种实施例中,所述利用预设的图片分类模型对待处理图像进行分类,得到分类结果,包括:利用二叉树分类法和图片分类模型对待处理图像进行分类,得到分类结果。在本专利技术的一种实施例中,所述根据所述哈希距离将所述待处理图像进行去除或保留,包括:判断所述哈希距离是否大于等于预设阈值,得到判断结果;当所述判断结果表明所述哈希距离大于预设阈值时,将所述待处理图像去除。在本专利技术的一种实施例中,所述根据所述哈希距离将所述待处理图像进行去除或保留,还包括:当所述判断结果表明所述哈希距离小于预设阈值时,从所述待处理图像所属的分类图片库获取作为对比图像的第二图像,所述第二图像与所述第一图像不同;计算所述待处理图像与所述对比图像之间的哈希距离;根据所述哈希距离将所述待处理图像进行去除或保留。第一方面,本专利技术实施例提供一种图像处理装置,所述装置包括分类单元、获取单元、计算单元和处理单元,其中:所述分类单元,用于利用预设的图片分类模型对待处理图像进行分类,得到分类结果;其中,所述图片分类模型是利用支持向量机法对分类图片库中的图片进行训练而得到的,所述分类结果表明所述待处理图像所属的分类图片库;所述获取单元,用于按照所述分类结果从所述待处理图像所属的分类图片库,获取作为对比图像的第一图像,所述第一图像为所述待处理图像所属的分类图片库中的一张图像;所述计算单元,用于计算所述待处理图像与所述对比图像之间的哈希距离;所述处理单元,用于根据所述哈希距离将所述待处理图像进行去除或保留。在本专利技术的一种实施例中,所述装置还包括形成单元,用于形成所述图片分类模型;其中,所述形成单元进一步包括筛选模块、分类模块、变换模块和
训练模块,其中:所述筛选模块,用于对初步过滤后的图片进行筛选,得到初级训练库;所述分类模块,用于对所述初级训练库中的图片进行分类,得到初步分类图片库;所述变换模块,用于对初步分类图片库中的每张图片进行仿射变换,得到作为标准分类的分类图片库;所述训练模块,用于利用支持向量机法对所述分类图片库中的图片进行训练,得到图片分类模型。在本专利技术的一种实施例中,所述训练模块进一步包括统一子模块、量化子模块和模拟子模块,其中:所述统一子模块,用于将所有的所述分类图片库中图片统一为一个颜色模型;所述量化子模块,用于对采用统一颜色模型表示的每一所述分类图片库中的图片进行量化;所述模拟子模块,用于采用支持向量机法对所述分类图片库中不同类别图片进行两两模拟,得到图片分类模型。在本专利技术的一种实施例中,所述分类单元,用于利用二叉树分类法和图片分类模型对待处理图像进行分类,得到分类结果。在本专利技术的一种实施例中,所述处理单元进一步包括判断模块和去除模块,其中:所述判断模块,用于判断所述哈希距离是否大于等于预设阈值,得到判断结果;所述去除模块,用于当所述判断结果表明所述哈希距离大于预设阈值时,将所述待处理图像去除。在本专利技术的一种实施例中,所述处理单元还包括获取模块、计算模块和处理模块,其中:所述获取模块,用于当所述判断结果表明所述哈希距离小于预设阈值时,
从所述待处理图像所属的分类图片库获取作为对比图像的第二图像,所述第二图像与所述第一图像不同;所述计算模块,用于计算所述待处理图像与所述对比图像之间的哈希距离;所述处理模块,用于根据所述哈希距离将所述待处理图像进行去除或保留。本专利技术实施例提供的图像处理方法及装置,利用预设的图片分类模型对待处理图像进行分类,得到分类结果;按照所述分类结果从所述待处理图像所属的分类图片库获取作为对比图像的第一图像,所述第一图像为所述待处理图像所属的分类图片库中的一张图像;计算所述待处理图像与所述对比图像之间的哈希距离;根据所述哈希距离将所述待处理图像进行去除或保留如此,具有图像分类针对性强、更加准确,图像匹配效率高,查全率高误判率低的技术优点。附图说明图1-1为网络上图片重复的一种示意图;图1-2为本专利技术实施例一图片分类模型的形成过程示意图;图1-3为本专利技术实施例一中二层的哈希小波变换的示意图;图1-4为本专利技术实施例一中相似图像条状化的示意图;图2为本专利技术实施例二图像处理方法的实现流程示意图;图3-1为本发本文档来自技高网
...
一种图像处理方法及装置

【技术保护点】
一种图像处理方法,其特征在于,所述方法包括:利用预设的图片分类模型对待处理图像进行分类,得到分类结果;其中,所述图片分类模型是利用支持向量机法对分类图片库中的图片进行训练而得到的,所述分类结果表明所述待处理图像所属的分类图片库;按照所述分类结果从所述待处理图像所属的分类图片库获取作为对比图像的第一图像,所述第一图像为所述待处理图像所属的分类图片库中的一张图像;计算所述待处理图像与所述对比图像之间的哈希距离;根据所述哈希距离将所述待处理图像进行去除或保留。

【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:利用预设的图片分类模型对待处理图像进行分类,得到分类结果;其中,所述图片分类模型是利用支持向量机法对分类图片库中的图片进行训练而得到的,所述分类结果表明所述待处理图像所属的分类图片库;按照所述分类结果从所述待处理图像所属的分类图片库获取作为对比图像的第一图像,所述第一图像为所述待处理图像所属的分类图片库中的一张图像;计算所述待处理图像与所述对比图像之间的哈希距离;根据所述哈希距离将所述待处理图像进行去除或保留。2.根据权利要求1所述的方法,其特征在于,所述图片分类模型采用方式形成:对初步过滤后的图片进行筛选,得到初级训练库;对所述初级训练库中的图片进行分类,得到初步分类图片库;对初步分类图片库中的每张图片进行仿射变换,得到作为标准分类的分类图片库;利用支持向量机法对所述分类图片库中的图片进行训练,得到图片分类模型。3.根据权利要求2所述的方法,其特征在于,所述利用支持向量机法对分类图片库中的图片进行训练,得到图片分类模型,包括:将所有的所述分类图片库中图片统一为一个颜色模型;对采用统一颜色模型表示的每一所述分类图片库中的图片进行量化;采用支持向量机法对所述分类图片库中不同类别图片进行两两模拟,得到图片分类模型。4.根据权利要求1所述的方法,其特征在于,所述利用预设的图片分类模型对待处理图像进行分类,得到分类结果,包括:利用二叉树分类法和图片分类模型对待处理图像进行分类,得到分类结果。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述哈
\t希距离将所述待处理图像进行去除或保留,包括:判断所述哈希距离是否大于等于预设阈值,得到判断结果;当所述判断结果表明所述哈希距离大于预设阈值时,将所述待处理图像去除。6.根据权利要求5所述的方法,其特征在于,所述根据所述哈希距离将所述待处理图像进行去除或保留,还包括:当所述判断结果表明所述哈希距离小于预设阈值时,从所述待处理图像所属的分类图片库获取作为对比图像的第二图像,所述第二图像与所述第一图像不同;计算所述待处理图像与所述对比图像之间的哈希距离;根据所述哈希距离将所述待处理图像进行去除或保留。7.一种图像处理装置,其特征在于,所述装置包括分类单元、获取单元、计算单元和处理单元,其中:所述分类单元,用于利用预设的图片分类模型对待处理图像进行分类,得到分类结果;其中,所...

【专利技术属性】
技术研发人员:安宁宇粟栗张峰檀鹏
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1