一种视频图像中叠加透明时间字符的夜间成像识别方法技术

技术编号：26260030 阅读：40 留言：0更新日期：2020-11-06 17:55

本发明专利技术属于计算机视觉领域，涉及一种夜间视频图像中透明时间标注信息的识别方法，包括：改进CRNN的训练过程配置；制作透明时间字符叠加夜间背景图像作为训练输入样本；引入二维注意力机制模块训练出适合夜间透明时间字符的识别模型；使用识别模型从夜间待检图像中输出时间识别结果并进行逻辑校验。本发明专利技术针对主流摄像机设备上透明时间标注信息的识别需求，使用夜间成像环境，初步提升透明时间字符与背景图像的差异性，并进一步增强透明时间字符的特征提取能力，构造了自然场景‘无衬底’叠加透明特征文本的识别模型，实现了夜间成像环境下、具备特征加权抽取能力的透明时间字符识别方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频图像中叠加透明时间字符的夜间成像识别方法
本专利技术属于计算机视觉领域，可用于公安及相关行业视频监控系统画面中叠加时间字符的检测。尤其涉及一种夜间视频图像中透明时间标注信息的识别方法。
技术介绍
在针对视频监控图像中叠加时间字符的识别方案设计过程中，发现某些主流品牌的摄像机在叠加字符时可能采用笔画透明(即非黑非白的灰色)显示的风格，这给本已面临诸多困难的‘无衬底’背景的字符识别带来了新的挑战。有实验数据显示，在相同的自然场景下，使用字符笔画透明风格比不透明(纯黑色或纯白色)风格，其识别准确率下降20％以上，严重影响了方案的预期应用效果。基于深度学习技术的图像中叠加时间字符的识别算法，为了获得较理想的效果，一般都会假定应用场景的约束条件——即在图像中采用规范的、纯黑色或纯白色、非透明风格标注叠加的字符。由于透明字符固有的低对比度属性，极容易与图像的自然背景产生混淆，而变得更加不易辨认，直接影响训练模型的性能。通过实验数据分析，单纯依靠算法训练来提升笔画透明字符的识别准确率，已经遇到了瓶颈。>
技术实现思路
...

【技术保护点】
1.一种视频图像中叠加透明时间字符的夜间成像识别方法，其特征在于，包括以下步骤：/n步骤i、改进CRNN通用文本识别网络的训练方法；/n步骤ii、制作CRNN夜间透明时间字符训练样本；/n步骤iii、引入注意力模块强化训练夜间透明时间字符识别模型；/n步骤iv、识别夜间待检图像中的透明时间字符并校验输出值的合理性。/n

【技术特征摘要】
1.一种视频图像中叠加透明时间字符的夜间成像识别方法，其特征在于，包括以下步骤：
步骤i、改进CRNN通用文本识别网络的训练方法；
步骤ii、制作CRNN夜间透明时间字符训练样本；
步骤iii、引入注意力模块强化训练夜间透明时间字符识别模型；
步骤iv、识别夜间待检图像中的透明时间字符并校验输出值的合理性。

2.根据权利要求1所述的视频图像中叠加透明时间字符的夜间成像识别方法，其特征在于，所述步骤i，改进CRNN通用文本识别网络的训练方法的具体步骤包括：
1-1)在主干ResNet分类网络的特征提取环节，采用3层采样，以保留字符的更多横向特征；
1-2)在提取字符高度特征时，使用最大值池化；
1-3)选择单层LSTM，将其输出的隐藏层向量，用于注意力向量计算。

3.根据权利要求1所述的视频图像中叠加透明时间字符的夜间成像识别方法，其特征在于，所述步骤ii，制作CRNN夜间透明时间字符训练样本的具体步骤包括：
2-1)在背景透明图像上，使用字符像素渲染函数在其上生成黑白颜色、多种字体、多种时间格式的时间字符；
2-2)使用PerlinNoise噪点图对上述时间字符笔画像素生成随机斑点；
2-3)对带有随机斑点的时间字符进行透明度处理，叠加到随机的夜间背景图像上作为训练的输入样本；
2-4)取2-1)中时间字符的文本形式，将其中非标准时...

【专利技术属性】
技术研发人员：聂晖，杨小波，李军，
申请(专利权)人：武汉东智科技股份有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人