识别图像叠加文字区域的神经网络模型构建方法与系统技术方案

技术编号:22689509 阅读:60 留言:0更新日期:2019-11-30 03:54
本申请的目的是通过识别图像叠加文字区域的神经网络模型构建,首选获取由带有叠加文字区域的样本图像组成的数据训练集,其中,所述样本图像的叠加文字区域已基于坐标值进行标注,然后基于所述数据训练集训练改进的神经网络模型,直至输出满足预设的训练阈值,完成可识别图像叠加文字区域的神经网络模型的构建。利用该神经网络模型对图像的各种类型的叠加文字区域进行识别,识别效果具有很高鲁棒性,识别效率高,对硬件资源占用少,具有非常好的市场价值。

Neural network model construction method and system for recognition of superimposed text area of image

The purpose of the application is to construct a neural network model for identifying the superimposed text area of an image, and first obtain a data training set composed of sample images with superimposed text area, wherein the superimposed text area of the sample image has been marked based on coordinate values, and then train the improved neural network model based on the data training set until the output meets the preset training Training threshold, completing the construction of neural network model which can recognize the superimposed text area of image. The neural network model is used to recognize all kinds of superimposed text areas of image. The recognition effect is very robust, the recognition efficiency is high, the hardware resource is less, and the market value is very good.

【技术实现步骤摘要】
识别图像叠加文字区域的神经网络模型构建方法与系统
本申请涉及计算机图像处理
,尤其涉及一种用于识别图像叠加文字区域的神经网络模型构建的技术。
技术介绍
目前电子警察图像已成为交通管理部门处理交通违法的重要证据。通常电子警察图像由多张连拍照片组成,在图像上方或下方叠加一些文字信息,以说明例如抓拍时间、地点、目标车辆车牌号码等。而在对这些叠加了文字信息的电子警察图像进行智能审核时,往往需要将这些图像拆分成单张图片以便进行车辆行为以及场景信息的识别。然而在图像上叠加文字往往会影响对图像有效部分、有效信息的正确识别。目前常规的做法是结合图像上叠加文字区域的像素值与有效区域的像素值之间的对比度,将图像进行灰度变换,接着利用灰度投影的变化识别文字区域叠加的边界,从而识别叠加文字区域。此种方法的鲁棒性不好,对于图像的叠加文字区域像素值与有效区域像素值之间的对比度不明显的情况,文字区域边界就不容易识别;还有一种情况是有些文字区域是直接叠加在图像的有效区域上或有部分重叠的,这种情况下传统方法也无法准确识别文字叠加区域的边界。
技术实现思路
本申请的目的是提供一种用于识别图像叠加文字区域的神经网络模型构建方法与系统。根据本申请的一个方面,提供了一种用于识别图像叠加文字区域的神经网络模型构建的方法,其特征在于,所述方法包括:获取由带有叠加文字区域的样本图像组成的数据训练集,其中,所述样本图像的叠加文字区域已基于坐标值进行标注;基于所述数据训练集训练改进的神经网络模型,直至输出满足预设的训练阈值。优选地,所述基于所述数据训练集训练改进的神经网络模型,直至输出满足预设的训练阈值之前,所述方法还包括:扩充所述数据训练集,其中,扩充所述数据训练集的方式包括以下至少任一项:对已标注的所述样本图像进行随机裁剪,将随机裁剪后的样本图像作为新的样本图像;通过模拟相机程序随机生成图像,并随机生成叠加文字区域叠加至所述图像上以作为新的样本图像。优选地,所述改进的神经网络模型为基于yolov3裁剪之后的神经网络模型。优选地,所述基于yolov3裁剪之后的神经网络模型结构是四组卷积与下采样全局池化层,然后连接三个卷积层,然后连接一个上采样层以及两个卷积层。优选地,所述识别图像叠加文字区域的神经网络模型构建的方法还包括:设置所述基于yolov3裁剪之后的神经网络模型的anchor初始化参数。优选地,所述随机生成叠加文字区域包括:确定所述叠加文字区域的大小预设范围、背景颜色预设范围以及所述叠加文字区域中的文字格式预设范围;基于上述预设范围随机从数据库中获取对应的背景颜色及文字格式,随机生成对应的叠加文字区域。优选地,所述识别图像叠加文字区域的神经网络模型构建的方法还包括:设置随机生成叠加文字区域的预设数目,随机生成对应所述预设数目的叠加文字区域。优选地,所述识别图像叠加文字区域的神经网络模型构建的方法还包括:获取待检测图像;将所述待检测图像输入所述神经网络模型识别所述待检测图像中的叠加文字区域;若验证所述叠加文字区域的识别无误,则从所述待检测图像中剪掉所述叠加文字区域,获得所述待检测图像的剩余部分;对所述待检测图像的剩余部分进行图像分析。与现有技术相比,本申请通过识别图像叠加文字区域的神经网络模型构建,首选获取由带有叠加文字区域的样本图像组成的数据训练集,其中,所述样本图像的叠加文字区域已基于坐标值进行标注,然后基于所述数据训练集训练改进的神经网络模型,直至输出满足预设的训练阈值,完成可识别图像叠加文字区域的神经网络模型的构建。利用该神经网络模型对图像的各种类型的叠加文字区域进行识别,识别效果具有很高鲁棒性,识别效率高,对硬件资源占用少,具有非常好的市场价值。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1示出根据本申请一个方面的一种识别图像叠加文字区域的神经网络模型构建方法流程图;图2示出根据本申请另一个方面的一种识别图像叠加文字区域的神经网络模型构建系统框图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本专利技术作进一步详细描述。在本申请一个典型的配置中,系统各模块和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存(flashRAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。为更进一步阐述本申请所采取的技术手段及取得的效果,下面结合附图及优选实施例,对本申请的技术方案,进行清楚和完整的描述。图1示出本申请一个方面的一种识别图像叠加文字区域的神经网络模型构建方法流程图,其中,一个实施例的方法包括:S11获取由带有叠加文字区域的样本图像组成的数据训练集,其中,所述样本图像的叠加文字区域已基于坐标值进行标注;S12基于所述数据训练集训练改进的神经网络模型,直至输出满足预设的训练阈值。在本申请中,所述方法通过设备1执行,所述设备1为计算机设备和/或云,所述计算机设备包括但不限于个人计算机、笔记本电脑、工业计算机、网络主机、单个网络服务器、多个网络服务器集;所述云由基于云计算(CloudComputing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。在此,所述计算机设备和/或云仅为举例,其他现有的或者今后可能出现的设备和/或资源共享平台如适用于本申请也应包含在本申请的保护范围内,在此,以引用的方式包含于此。在该实施例中,在所述步骤S11中,获取由带有叠加文字区域的样本图像组成的数据训练集,其中,所述带有叠加文字区域的样本图像中的叠加文字区域已基于坐标值进行标注。其中,获取相应的带有本文档来自技高网...

【技术保护点】
1.一种用于识别图像叠加文字区域的神经网络模型构建方法,其特征在于,所述方法包括:/n获取由带有叠加文字区域的样本图像组成的数据训练集,其中,所述样本图像的叠加文字区域已基于坐标值进行标注;/n基于所述数据训练集训练改进的神经网络模型,直至输出满足预设的训练阈值。/n

【技术特征摘要】
1.一种用于识别图像叠加文字区域的神经网络模型构建方法,其特征在于,所述方法包括:
获取由带有叠加文字区域的样本图像组成的数据训练集,其中,所述样本图像的叠加文字区域已基于坐标值进行标注;
基于所述数据训练集训练改进的神经网络模型,直至输出满足预设的训练阈值。


2.根据权利要求1所述的方法,其特征在于,所述基于所述数据训练集训练改进的神经网络模型,直至输出满足预设的训练阈值之前,所述方法还包括:
扩充所述数据训练集,其中,扩充所述数据训练集的方式包括以下至少任一项:
对已标注的所述样本图像进行随机裁剪,将随机裁剪后的样本图像作为新的样本图像;
通过模拟相机程序随机生成图像,并随机生成叠加文字区域叠加至所述图像上以作为新的样本图像。


3.根据权利要求1或2所述的方法,其特征在于,所述改进的神经网络模型为基于yolov3裁剪之后的神经网络模型。


4.根据权利要求3所述的方法,其特征在于,所述基于yolov3裁剪之后的神经网络模型结构是四组卷积与下采样全局池化层,然后连接三个卷积层,然后连接一个上采样层以及两个卷积层。


5.根据权利要求3或4中任一项所述的方法,其特征在于,所述方法还包括:
设置所述基于yolov3裁剪之后的神经网络模型的anchor初始化参数。

<...

【专利技术属性】
技术研发人员:周康明
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1