一种基于深度网络模型敏感旗帜内容的层次分类方法技术

技术编号：15220036 阅读：50 留言：0更新日期：2017-04-26 19:43

本发明专利技术公开了一种基于深度网络模型敏感旗帜内容的层次分类方法，在常规的样本类别划分方法上做出了调整，对训练样本进行了多角度、多层次的精细化划分，应用层级分类策略，在简单的正、负样本二类划分的基础上进行细化，得到类间差异更大、类内相似性更小的样本类别。实验结果证明，这样的训练数据有助于增加深度学习网络对图片特征的学习能力，在很大程度上提高深度学习网络模型对于敏感旗帜图片的识别能力，能够使模型更好的完成对敏感旗帜图片的识别任务，有效减少了分类错误的情况。

A hierarchical classification method based on depth network model sensitive banner content

Hierarchical classification method of the invention discloses a network model based on depth sensitive banner content in the sample, the classification method of the conventional and made adjustments to the training samples are finely divided multi angle and multi-level strategy, application level classification, refinement based on positive and negative samples of simple two classes get on, difference is bigger, within the same category of smaller sample categories. The experimental results show that the training data that helps to increase the learning ability of deep learning network image features, improve the recognition ability of deep learning network model for the sensitive flag. To a great extent, can make the model better for sensitive flags. Recognition task, effectively reduce the classification error.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习和图像识别领域，特别涉及一种基于深度网络模型敏感旗帜内容的层次分类方法。
技术介绍
随着互联网技术的发展，信息的传播速度越来越快。图像数据是互联网数据中最重要的组成元素之一，它可以从空间等维度上更逼真地记录更多细节内容。但是，网络中海量的数据信息给人们带来方便的同时，也带来了很多负面的影响。一些包含敏感内容的图片在互联网中的广泛传播严重威胁了网络安全，危害了互联网用户的用网安全。为了保障网络环境的健康，需要从海量的数据中筛选出这些包含有敏感内容的图片。针对包含有敏感内容图片的筛选，目前经常采用的方法有下面几种：(1)人工检测人工检测的方法是最原始的图片筛选方法，该方法唯一的优点就是精度高，缺点是该方法需要的人力成本大，检测速度慢，标准存在差异，面对海量的互联网图片数据，效果并不理想。(2)MD5匹配利用图片的MD5值进行含有敏感内容图片的查找，能够精准的根据已有的敏感图片在网络里的海量图片数据中筛选出和这些已有图片相同的数据，而且速度比较快。这种方法的缺点是：只能从网络中的海量数据中筛选出和已经拥有的敏感图片完全相同的图片，只要两张图片间存在一点差异，基于MD5的筛选方法就不能生效。
技术实现思路
本专利技术要解决的技术问题：本专利技术的目的是为了解决现有技术中的不足，提供一种可满足多样的敏感旗帜图片内容检测需求，且对网络数据进行筛选时速度快，精度高而且召回率高的一种基于深度网络模型敏感旗帜内容的层次分类方法。本专利技术的技术方案：本专利技术所述的一种基于深度网络模型敏感旗帜内容的层次分类方法，包括以下步骤：a.从训练样本数据集合中的海...

【技术保护点】
一种基于深度网络模型敏感旗帜内容的层次分类方法，包括以下步骤：a.从训练样本数据集合中的海量网络数据文件中获取足够多的训练样本，形成训练数据集合，输送至图像二分类模块中；b.在所述图像二分类模块中，将所述训练数据集合中的训练样本分为正样本Y和负样本N两个类别，输送至图像细化分模块中；c.在所述图像细化分模块中，将得到的所述正样本和负样本两类训练样本划分为更细的类别，将细分好的训练数据用于模型的训练，最终形成深度网络模型。

【技术特征摘要】
1.一种基于深度网络模型敏感旗帜内容的层次分类方法，包括以下步骤：a.从训练样本数据集合中的海量网络数据文件中获取足够多的训练样本，形成训练数据集合，输送至图像二分类模块中；b.在所述图像二分类模块中，将所述训练数据集合中的训练样本分为正样本Y和负样本N两个类别，输送至图像细化分模块中；c.在所述图像细化分模块中，将得到的所述正样本和负样本两类训练样本划分为更细的类别，将细分好的训练数据用于模型的训练，最终形成深度网络模型。2.根据权利要求1中所述的一种基于深度网络模型敏感旗帜内容的层次分类方法，其特征在于：所述图像二分类模块将训练样本分为正、负样本两个类别的标准是：所述训练样本中是否含有敏感组织的旗帜；若训练样本中含有敏感组织的旗帜，那么我们将其划分为正样本Y；否则，我么将其划分为负样本N。3.根据权利要求1中所述的一种基于深度网络模型敏...

【专利技术属性】
技术研发人员：丁琴，
申请(专利权)人：南京睿观信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人