海量网络文本与非文本图像分类方法技术

技术编号：14313656 阅读：73 留言：0更新日期：2016-12-30 15:15

本发明专利技术公开了一种海量网络文本与非文本图像分类方法，首先构建多尺度空间划分网络，然后对训练图像集中的图像，获取图像的多尺度图像块标签信息，并根据构建的多尺度空间划分网络，利用标注好的训练数据集训练多尺度空间划分网络的网络参数，然后利用构建的多尺度空间划分网络以及训练得到的网络参数，对待测试的大规模网络图像进行分类，最终获取图像的分类结果，对图像是否为文本图像做出判决，并获取文本区域在图像中的大致位置。本发明专利技术方法文本与非文本图像分类准确率高，且有很高的分类效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉
，更具体地，涉及一种海量网络文本与非文本图像分类方法。
技术介绍
随着电视、互联网的飞速发展，人类社会已经逐渐迈入了信息时代，今后，人类的经济生活将以信息的占有、配置、生产、使用为主。而随着信息时代的到来，越来越多的图像视频数据以各式各样的途径传播，而这些数据包含大量的有用信息，如何从这些海量的数据中提取出这些有用的信息，将是信息时代人类能否快速高效地获取更多收益的关键。当前互联网中提供了海量的视频、图像数据，而这些海量的网络视频帧与网络图像中的文本作为一种极其重要的信息来源，可以被用来辅助于多种实际应用，包括图像检索、人机交互和驾驶导航系统等等。现有的获取图像中的文本信息的方法主要包含文本检测和文本识别两部分，因此这两个图像文本自动阅读的主要技术的研究一直是计算机领域备受关注的课题。然而，在海量传播的数据中，只有极少部分的图像包含文本，而现有的文本检测和文本识别方法受限于提取图像中文本信息的速度，很难直接用于提取这些数据中的有用文本信息，因此关于文本与非文本图像分类算法的研究具备较高的现实意义和使用价值。
技术实现思路
本专利技术的目的在于提供一种海量网络文本与非文本图像分类方法，该方法文本与非文本图像分类过程简单易行，且分类准确率高。为实现上述目的，本专利技术提供了一种海量网络文本与非文本图像分类方法，包括如下步骤：(1)多尺度空间划分网络构建，所述的多尺度空间划分网络包括多层次特征图生成子网络、多尺度图像块特征生成子网络以及文本与非文本图像块分类子网络：(1.1)定义多层次特征图生成子网络网络结构；(1.1.1)定义图像...
海量网络文本与非文本图像分类方法

【技术保护点】
一种海量网络文本与非文本图像分类方法，其特征在于，所述方法包含下述步骤：(1)多尺度空间划分网络构建，包括：(1.1)定义多层次特征图生成子网络网络结构；(1.2)定义多尺度图像块特征生成子网络网络结构；(1.3)定义文本与非文本图像块分类子网络网络结构；(1.4)构建多尺度空间划分网络；(2)多尺度空间划分网络训练：(2.1)对训练图像集中的每一张图像，获取多尺度图像块标签信息；(2.2)根据所述多尺度图像块标签信息训练得到多尺度空间划分网络的参数；(3)文本与非文本图像分类：根据多尺度空间划分网络的参数，利用所述多尺度空间划分网络对待识别文本或者非文本图像进行分类。

【技术特征摘要】
1.一种海量网络文本与非文本图像分类方法，其特征在于，所述方法包含下述步骤：(1)多尺度空间划分网络构建，包括：(1.1)定义多层次特征图生成子网络网络结构；(1.2)定义多尺度图像块特征生成子网络网络结构；(1.3)定义文本与非文本图像块分类子网络网络结构；(1.4)构建多尺度空间划分网络；(2)多尺度空间划分网络训练：(2.1)对训练图像集中的每一张图像，获取多尺度图像块标签信息；(2.2)根据所述多尺度图像块标签信息训练得到多尺度空间划分网络的参数；(3)文本与非文本图像分类：根据多尺度空间划分网络的参数，利用所述多尺度空间划分网络对待识别文本或者非文本图像进行分类。2.根据权利要求1所述的海量网络文本与非文本图像分类方法，其特征在于，所述步骤(1.1)具体为：(1.1.1)定义图像特征提取网络结构：所述的图像特征提取网络结构包括五个卷积阶段，其中第一个和第二个卷积阶段的网络结构均为两个卷积层和一个最大池化层，最后三个卷积阶段的网络结构均为三个卷积层和一个最大池化层，对输入图像I，经过该图像特征提取网络得到各个卷积阶段的输出特征图，记为其中表示第s个卷积阶段的输出的特征图序列，Ms,m表示第m个特征图，MNums为预设的第s个卷积阶段输出特征图的个数；(1.1.2)定义多层次特征图生成子网络网络结构：对步骤(1.1.1)中所述的图像特征提取网络的后三个卷积阶段之后分别接一个反卷积层，将这三个卷积阶段的输出中的所有特征图的尺度全部缩放到Wm×Hm大小，所得尺度缩放后的特征图序列记为其中Wm和Hm分别表示预设的特征图尺度缩放后特征图宽度和高度，表示第s个卷积阶段的输出特征图序列FMs中的每个特征图经过尺度缩放后得到的特征图序列，Ms′,m表示FMs中第m个特征图经过尺度缩放后得到的特征图，MNums为预设的第s个卷积阶段输出特征图的个数，之后将FMS′中的所有特征图进行堆叠，得到多层次特征图，记为其中M″c表示图像的多层次特征图的c个特征图，MNum＝MNum3+MNum4+MNum5，表示多层次特征图中特征图个数。3.根据权利要求1或2所述的海量网络文本与非文本图像分类方法，其特征在于，所述步骤(1.2)具体为：(1.2.1)单一尺度图像块空间划分：对步骤(1.1)所述的多层次特征图生成子网络得到的图像多层次特征图F，将多层次特征图划分为尺度为的图像块，划分方法表示为： F i j ( x , y ) = F ( x + i W m s p , y + j H m s p ) , 0 ≤ x < W m s p 0 ≤ y < H m s p ...

【专利技术属性】
技术研发人员：白翔，石葆光，章成全，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人