一种图像分类方法及卷积神经网络生成方法技术

技术编号:18942070 阅读:22 留言:0更新日期:2018-09-15 11:23
本发明专利技术公开了一种图像分类方法、用于对图像进行分类处理的卷积神经网络生成方法、用于对图像中的文字进行识别的卷积神经网络生成方法、移动终端及计算设备,所述图像分类方法适于在移动终端中执行,所述移动终端包括图像库,所述图像库中存储有多张图像,所述图像分类方法包括步骤:对图像库中的每一张图像,对该图像进行分类处理以获取其对应的类别;若所述类别为文本类,则对该图像进行文字识别,以提取出该图像所包含的文本信息;将所述文本信息与该图像的图像存储路径及图像名称进行关联存储。

Image classification method and convolution neural network generation method

The invention discloses an image classification method, a convolution neural network generation method for classifying and processing an image, a convolution neural network generation method for recognizing text in an image, a mobile terminal and a computing device. The image classification method is suitable for execution in a mobile terminal, and the mobile terminal packet. Including an image library, the image library stores a plurality of images, and the image classification method comprises steps of: classifying each image in the image library to obtain its corresponding category; if the category is a text class, then recognizing the image to extract the text contained in the image. Information; associating the text information with the image storage path and the image name of the image.

【技术实现步骤摘要】
一种图像分类方法及卷积神经网络生成方法
本专利技术涉及图像处理
,特别涉及一种图像分类方法、用于对图像进行分类处理的卷积神经网络生成方法、用于对图像中的文字进行识别的卷积神经网络生成方法、移动终端及计算设备。
技术介绍
随着硬件技术的不断发展,越来越多的人开始使用如智能手机、平板电脑等移动终端进行照片拍摄并存储,以记录下珍贵的瞬间。当移动终端中所保存的照片数量越来越多时,由于照片繁多,又都分属不同的类别,常常会出现无法及时寻找出某一张照片的情况,给用户带来较差的体验。现有的图像分类算法,通常是将移动终端的相册里的图像分为各个类别,按照类别进行图像管理,但不会再进行进一步操作。这样的处理方式虽然方便用于根据类别来查找图像,但如果要快速定位到某一张具有特定信息的图像则无法实现,比如说用户对一张图像上面的部分文字有印象,但其他内容却不记得,此时就难以通过用户自身对该图像的类别认知,来迅速且准确地获取到所需图像及图像中所包含的信息。因此,需要提供一种新的图像分类方法来改进上述处理过程。
技术实现思路
为此,本专利技术提供一种图像分类方案,并提供了用于对图像进行分类处理的卷积神经网络生成方案和用于对图像中的文字进行识别的卷积神经网络生成方案,以力图解决或者至少缓解上面存在的问题。根据本专利技术的一个方面,提供一种图像分类方法,适于在移动终端中执行,移动终端包括图像库,图像库中存储有多张图像,该方法包括如下步骤:首先,对图像库中的每一张图像,对该图像进行分类处理以获取其对应的类别;若类别为文本类,则对该图像进行文字识别,以提取出该图像所包含的文本信息;将文本信息与该图像的图像存储路径及图像名称进行关联存储。可选地,在根据本专利技术的图像分类方法中,当接收到用户键入的检索词时,该方法还包括:根据检索词查找是否存在与其相同或相似的文本信息;若存在,则获取该文本信息关联的图像存储路径;根据该图像存储路径查找到其对应的图像,将该图像和该文本信息向用户展示。可选地,在根据本专利技术的图像分类方法中,对该图像进行文字识别,以提取出该图像所包含的文本信息的步骤包括:获取该图像所包含的各单个文字对应的文字图像区域;分别对各文字图像区域进行文字识别,以确定各文字图像区域所包含的文字;基于各文字生成该图像对应的文本信息。可选地,在根据本专利技术的图像分类方法中,基于各文字生成该图像对应的文本信息的步骤包括:获取该图像中各文字图像区域之间的位置关系;根据位置关系,对各文字图像区域对应的文字进行组合,以生成该图像对应的文本信息。可选地,在根据本专利技术的图像分类方法中,移动终端中存储有用于对图像进行分类处理的、训练好的第一卷积神经网络,对该图像进行分类处理以获取其对应的图像类型的步骤包括:将该图像输入到训练好的第一卷积神经网络中进行图像分类;根据该第一卷积神经网络的输出确定该图像的类别。可选地,在根据本专利技术的图像分类方法中,移动终端中存储有用于对图像中的文字进行识别的、训练好的第二卷积神经网络,对该图像进行文字识别,以提取出该图像所包含的文本信息的步骤包括:获取该图像所包含的各单个文字对应的文字图像区域;分别将各文字图像区域输入到训练好的第二卷积神经网络中进行文字识别,根据该第二卷积神经网络的输出确定各文字图像区域所包含的文字;基于各文字生成该图像对应的文本信息。可选地,在根据本专利技术的图像分类方法中,训练好的第一卷积神经网络通过以下方式获取得到:构建处理块,处理块包括卷积层;分别构建池化层、全连接层和分类器;根据多个处理块和池化层,结合全连接层和分类器构建第一卷积神经网络,第一卷积神经网络以处理块为输入,以分类器为输出;根据预先获取的图像类别数据集合对第一卷积神经网络进行训练,以便分类器的输出指示输入图像所对应的类别,图像类别数据集合包括多个图像类别信息,每个图像类别信息包括满足预设尺寸的第一图像和该第一图像对应的类别信息。可选地,在根据本专利技术的图像分类方法中,训练好的第二卷积神经网络通过以下方式获取得到:构建第一处理块,第一处理块包括第一卷积层;构建第二处理块,第二处理块包括第一全连接层;分别构建第一池化层、第二全连接层和第一分类器;根据一个或多个第一处理块、第一池化层和第二处理块,结合第二全连接层和第一分类器构建第二卷积神经网络,第二卷积神经网络以第一处理块为输入,以第一分类器为输出;根据预先获取的文字图像数据集合对第二卷积神经网络进行训练,以便第一分类器的输出指示输入图像中包含的文字,文字图像数据集合包括多个文字图像信息,每个文字图像信息包括满足第一预设尺寸的文字图像和该文字图像中所包含的文字信息。根据本专利技术的又一个方面,提供一种移动终端,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行根据本专利技术的图像分类方法的指令。根据本专利技术的又一个方面,提供一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由移动终端执行时,使得移动终端执行根据本专利技术的图像分类方法。根据本专利技术的又一个方面,提供一种用于对图像进行分类处理的卷积神经网络生成方法,适于在计算设备中执行,该方法包括如下步骤:首先,构建处理块,处理块包括卷积层;分别构建池化层、全连接层和分类器;根据多个处理块和池化层,结合全连接层和分类器构建卷积神经网络,卷积神经网络以处理块为输入,以分类器为输出;根据预先获取的图像类别数据集合对卷积神经网络进行训练,以便分类器的输出指示输入图像所对应的类别,图像类别数据集合包括多个图像类别信息,每个图像类别信息包括满足预设尺寸的第一图像和该第一图像对应的类别信息。可选地,在根据本专利技术的用于对图像进行分类处理的卷积神经网络生成方法中,构建处理块的步骤还包括:构建激活层;在卷积层之后添加激活层,以形成处理块。可选地,在根据本专利技术的用于对图像进行分类处理的卷积神经网络生成方法中,池化层为最大池化层和平均池化层中任一种。可选地,在根据本专利技术的用于对图像进行分类处理的卷积神经网络生成方法中,根据多个处理块和池化层,结合全连接层和分类器构建卷积神经网络的步骤包括:按照预设的连接规则,将各处理块和最大池化层进行相连后,连接平均池化层;在平均池化层之后添加依次相连的全连接层和分类器,以构建以处理块为输入,以分类器为输出的卷积神经网络。可选地,在根据本专利技术的用于对图像进行分类处理的卷积神经网络生成方法中,根据预先获取的图像类别数据集合对卷积神经网络进行训练,以便分类器的输出指示输入图像所对应的类别的步骤包括:对每一个提取出的图像类别信息,以该图像类别信息所包括的第一图像为卷积神经网络中第一个处理块的输入,以该图像类别信息所包括的类别信息为分类器的输出,对卷积神经网络进行训练。可选地,在根据本专利技术的用于对图像进行分类处理的卷积神经网络生成方法中,处理块的数量为3。可选地,在根据本专利技术的用于对图像进行分类处理的卷积神经网络生成方法中,最大池化层的数量为2,平均池化层的数量为1。可选地,在根据本专利技术的用于对图像进行分类处理的卷积神经网络生成方法中,类别信息为动物类、建筑类、实物类、风景类、人物类和文本类中的任一种。可选地,在根据本专利技术的用于对图像进行分类处理的卷积神经网络本文档来自技高网...

【技术保护点】
1.一种图像分类方法,适于在移动终端中执行,所述移动终端包括图像库,所述图像库中存储有多张图像,所述方法包括步骤:对图像库中的每一张图像,对该图像进行分类处理以获取其对应的类别;若所述类别为文本类,则对该图像进行文字识别,以提取出该图像所包含的文本信息;将所述文本信息与该图像的图像存储路径及图像名称进行关联存储。

【技术特征摘要】
1.一种图像分类方法,适于在移动终端中执行,所述移动终端包括图像库,所述图像库中存储有多张图像,所述方法包括步骤:对图像库中的每一张图像,对该图像进行分类处理以获取其对应的类别;若所述类别为文本类,则对该图像进行文字识别,以提取出该图像所包含的文本信息;将所述文本信息与该图像的图像存储路径及图像名称进行关联存储。2.如权利要求1所述的方法,当接收到用户键入的检索词时,所述方法还包括:根据所述检索词查找是否存在与其相同或相似的文本信息;若存在,则获取该文本信息关联的图像存储路径;根据该图像存储路径查找到其对应的图像,将该图像和该文本信息向用户展示。3.如权利要求1或2所述的方法,所述对该图像进行文字识别,以提取出该图像所包含的文本信息的步骤包括:获取该图像所包含的各单个文字对应的文字图像区域;分别对各文字图像区域进行文字识别,以确定各文字图像区域所包含的文字;基于各文字生成该图像对应的文本信息。4.如权利要求3所述的方法,所述基于各文字生成该图像对应的文本信息的步骤包括:获取该图像中各文字图像区域之间的位置关系;根据所述位置关系,对各文字图像区域对应的文字进行组合,以生成该图像对应的文本信息。5.一种移动终端,包括:一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-4中任一项所述的方法的指令。6.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由移动终端执行时,使得所述移动终端执行根据权利要求1-4中任一项的方法。7.一种用于对图像进行分类处理的卷积神经网络生成方法,适于在计算设备中执行...

【专利技术属性】
技术研发人员:林煜余清洲许清泉苏晋展张伟
申请(专利权)人:厦门美图之家科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1