图像识别、训练、搜索方法和装置及设备、介质制造方法及图纸

技术编号:21514440 阅读:40 留言:0更新日期:2019-07-03 09:12
本申请实施例提供了一种图像识别、训练、搜索方法和装置及设备、介质,以提高图像中文字识别的准确性。所述的包括:获取图像,所述图像包括文字信息;采用识别器对所述图像进行识别,获取所述图像中的文字区域信息,其中,所述识别器基于全卷积网络对不同环境下获取的文字图像数据进行训练确定;根据所述文字区域信息,确定图像中的文字。能够对各种图像中包含的文字进行识别,提高识别的准确性。

Image Recognition, Training, Search Method and Devices, Equipment and Media

【技术实现步骤摘要】
图像识别、训练、搜索方法和装置及设备、介质
本申请涉及图像处理
,特别是涉及一种图像识别方法和装置,一种识别器的训练方法和装置,一种搜索方法和装置,一种电子设备,一种存储介质,以及一种操作系统。
技术介绍
通过计算机来识别英文符号和数字方面的研究始于上世纪50年代末,从70年代起,国内外陆续开始了对印刷体文字和手写体文字的识别研究。目前文字识别方法有多种,但是自然场景等情况下,文字通常会发生变换,如旋转、透视、仿射等。而现有的大多数文字检测方法对于文字发生旋转、透视、仿射等形状变换时,都不能很好的实现文字行的检测。以基于最大平稳极值区域(MaximallyStableExtremalRegions,MSER)的文字识别方法为例,若文字对比度很低、背景区域复杂或者文字区域存在较大的形变,则MSER方式的识别结果比较不准确。
技术实现思路
本申请实施例所要解决的技术问题是提供一种图像识别方法,以提高图像中文字识别的准确性。相应的,本申请实施例还提供了一种图像识别装置、一种识别器的训练方法和装置、一种搜索方法和装置、一种电子设备、一种存储介质和一种操作系统,用以保证上述方法的实现及应用。本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,包括:获取图像,所述图像包括文字信息;采用识别器对所述图像进行识别,获取所述图像中的文字区域信息,其中,所述识别器基于全卷积网络对不同环境下获取的文字图像数据进行训练确定;根据所述文字区域信息,确定图像中的文字。

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取图像,所述图像包括文字信息;采用识别器对所述图像进行识别,获取所述图像中的文字区域信息,其中,所述识别器基于全卷积网络对不同环境下获取的文字图像数据进行训练确定;根据所述文字区域信息,确定图像中的文字。2.根据权利要求1所述的方法,其特征在于,所述识别器包括特征学习器、分类器、回归分析器,所述特征学习器基于所述全卷积网络构建。3.根据权利要求2所述的方法,其特征在于,所述采用识别器对所述图像进行识别,获取所述图像中的文字区域信息,包括:采用所述识别器中的特征学习器对图像进行特征提取,从所述图像中提取特征向量;采用所述识别器中的分类器对所述特征向量进行分类处理,确定属于文字类的特征向量;采用所述识别器中的回归分析器对所述文字类的特征向量进行分析,确定所述图像中的文字区域信息。4.根据权利要求3所述的方法,其特征在于,所述采用所述识别器中的回归分析器对所述文字类的特征向量进行分析,确定所述图像中的文字区域信息,包括:采用所述识别器中的回归分析器对所述文字类的特征向量进行回归处理,确定所述图像中的文字区域,以及所述文字区域对应坐标信息。5.根据权利要求1所述的方法,其特征在于,所述根据文字区域信息,确定图像中的文字,包括:对识别的文字区域信息进行聚类,确定同一类的文字区域信息;将同一类的文字区域信息进行合并,确定所述图像中的文字行。6.根据权利要求5所述的方法,其特征在于,所述对识别的文字区域信息进行聚类,确定同一类的文字区域信息,包括:计算两个文字区域信息的交并比,判断所述交并比是否大于重叠阈值;在判断所述交并比大于重叠阈值后,确定两个文字区域信息属于同一类。7.根据权利要求5所述的方法,其特征在于,所述文字区域信息包括:方向信息;属于同一类的两个文字区域信息对应方向信息一致。8.根据权利要求6所述的方法,其特征在于,所述文字区域信息包括:方向信息和坐标信息,所述计算两个文字区域信息的交并比,包括:对于文字方向一致的两个文字区域信息,按照坐标信息计算所述两个文字区域信息的交并比。9.根据权利要求5所述的方法,其特征在于,所述将同一类的文字区域信息进行合并,确定所述图像中的文字行,包括:将同一类的文字区域信息按照几何规则进行合并,确定所述图像中的文字行。10.根据权利要求5或9所述的方法,其特征在于,还包括:对所述图像中的文字行进行切割,得到对应的切分信息,其中,所述切分信息包括以下至少一项:字、词、词组、短语。11.根据权利要求1所述的方法,其特征在于,还包括生成识别器的步骤,包括:从文字图像数据库中获取各文字图像,以及所述文字图像中的文字信息;采用基于全卷积网络构建的识别器对所述各文字图像进行识别,确定区域识别结果;依据所述文字图像的区域识别结果和文字图像中的文字信息进行比较,对所述识别器的参数进行调整。12.根据权利要求11所述的方法,其特征在于,采用基于全卷积网络构建的识别器对所述各文字图像进行识别,确定区域识别结果,包括:采用全卷积网络构建的特征学习器对所述文字图像进行特征提取,从所述文字图像中提取特征向量;采用分类器对所述特征向量进行分类处理,确定所述特征向量的类别信息;采用所述识别器中的回归分析器依据所述文字类的特征向量进行分析,确定所述文字图像中的文字区域信息。13.根据权利要求12所述的方法,其特征在于,所述类别信息包括文字类和非文字类。14.根据权利要求12所述的方法,其特征在于,所述依据文字图像的区域识别结果和文字图像中的文字信息进行比较,对所述识别器的参数进行调整,包括:计算所述文字图像的区域识别结果和文字图像中的文字信息的差值;对所述差值进行误差处理,确定调整权值;采用所述调整权值对所述识别器的参数进行调整,所述识别器的参数包括:特征学习器的参数、分类器的参数和/或回归分析器的参数。15.根据权利要求1所述的方法,其特征在于,还包括:判断图像中识别的文字与搜索关键词是否匹配;若所述图像中识别的文字与搜索关键词匹配,将所述图像作为所述关键词对应的搜索结果。16.根据权利要求1所述的方法,其特征在于,所述图像中的文字信息包括:一种或多种尺寸的文字信息。17.根据权利要求1所述的方法,其特征在于,所述图像中的文字信息包括:发生形变的文字信息。18.一种识别器的训练方法,其特征在于,包括:从文字图像数据库中获取各文字图像,以及所述文字图像中的文字信息;...

【专利技术属性】
技术研发人员:曹恩华易东楚汝峰
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1