识别图像叠加文字区域的神经网络模型构建方法与系统技术方案

技术编号：22689509 阅读：60 留言：0更新日期：2019-11-30 03:54

本申请的目的是通过识别图像叠加文字区域的神经网络模型构建，首选获取由带有叠加文字区域的样本图像组成的数据训练集，其中，所述样本图像的叠加文字区域已基于坐标值进行标注，然后基于所述数据训练集训练改进的神经网络模型，直至输出满足预设的训练阈值，完成可识别图像叠加文字区域的神经网络模型的构建。利用该神经网络模型对图像的各种类型的叠加文字区域进行识别，识别效果具有很高鲁棒性，识别效率高，对硬件资源占用少，具有非常好的市场价值。

Neural network model construction method and system for recognition of superimposed text area of image

The purpose of the application is to construct a neural network model for identifying the superimposed text area of an image, and first obtain a data training set composed of sample images with superimposed text area, wherein the superimposed text area of the sample image has been marked based on coordinate values, and then train the improved neural network model based on the data training set until the output meets the preset training Training threshold, completing the construction of neural network model which can recognize the superimposed text area of image. The neural network model is used to recognize all kinds of superimposed text areas of image. The recognition effect is very robust, the recognition efficiency is high, the hardware resource is less, and the market value is very good.

全部详细技术资料下载

【技术实现步骤摘要】
识别图像叠加文字区域的神经网络模型构建方法与系统
本申请涉及计算机图像处理
，尤其涉及一种用于识别图像叠加文字区域的神经网络模型构建的技术。
技术介绍
目前电子警察图像已成为交通管理部门处理交通违法的重要证据。通常电子警察图像由多张连拍照片组成，在图像上方或下方叠加一些文字信息，以说明例如抓拍时间、地点、目标车辆车牌号码等。而在对这些叠加了文字信息的电子警察图像进行智能审核时，往往需要将这些图像拆分成单张图片以便进行车辆行为以及场景信息的识别。然而在图像上叠加文字往往会影响对图像有效部分、有效信息的正确识别。目前常规的做法是结合图像上叠加文字区域的像素值与有效区域的像素值之间的对比度，将图像进行灰度变换，接着利用灰度投影的变化识别文字区域叠加的边界，从而识别叠加文字区域。此种方法的鲁棒性不好，对于图像的叠加文字区域像素值与有效区域像素值之间的对比度不明显的情况，文字区域边界就不容易识别；还有一种情况是有些文字区域是直接叠加在图像的有效区域上或有部分重叠的，这种情况下传统方法也无法准确识别文字叠加区域的边界。
技术实现思路
本申请的目的是提供一种用于识别图像叠加文字区域的神经网络模型构建方法与系统。根据本申请的一个方面，提供了一种用于识别图像叠加文字区域的神经网络模型构建的方法，其特征在于，所述方法包括：获取由带有叠加文字区域的样本图像组成的数据训练集，其中，所述样本图像的叠加文字区域已基于坐标值进行标注；基于所述数据训练集训练改进的神经网络模型，直至输出满足预...

【技术保护点】
1.一种用于识别图像叠加文字区域的神经网络模型构建方法，其特征在于，所述方法包括：/n获取由带有叠加文字区域的样本图像组成的数据训练集，其中，所述样本图像的叠加文字区域已基于坐标值进行标注；/n基于所述数据训练集训练改进的神经网络模型，直至输出满足预设的训练阈值。/n

【技术特征摘要】
1.一种用于识别图像叠加文字区域的神经网络模型构建方法，其特征在于，所述方法包括：
获取由带有叠加文字区域的样本图像组成的数据训练集，其中，所述样本图像的叠加文字区域已基于坐标值进行标注；
基于所述数据训练集训练改进的神经网络模型，直至输出满足预设的训练阈值。

2.根据权利要求1所述的方法，其特征在于，所述基于所述数据训练集训练改进的神经网络模型，直至输出满足预设的训练阈值之前，所述方法还包括：
扩充所述数据训练集，其中，扩充所述数据训练集的方式包括以下至少任一项：
对已标注的所述样本图像进行随机裁剪，将随机裁剪后的样本图像作为新的样本图像；
通过模拟相机程序随机生成图像，并随机生成叠加文字区域叠加至所述图像上以作为新的样本图像。

3.根据权利要求1或2所述的方法，其特征在于，所述改进的神经网络模型为基于yolov3裁剪之后的神经网络模型。

4.根据权利要求3所述的方法，其特征在于，所述基于yolov3裁剪之后的神经网络模型结构是四组卷积与下采样全局池化层，然后连接三个卷积层，然后连接一个上采样层以及两个卷积层。

5.根据权利要求3或4中任一项所述的方法，其特征在于，所述方法还包括：
设置所述基于yolov3裁剪之后的神经网络模型的anchor初始化参数。

<...

【专利技术属性】
技术研发人员：周康明，
申请(专利权)人：上海眼控科技股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人