【技术实现步骤摘要】
一种视频图像中叠加透明时间字符的夜间成像识别方法
本专利技术属于计算机视觉领域,可用于公安及相关行业视频监控系统画面中叠加时间字符的检测。尤其涉及一种夜间视频图像中透明时间标注信息的识别方法。
技术介绍
在针对视频监控图像中叠加时间字符的识别方案设计过程中,发现某些主流品牌的摄像机在叠加字符时可能采用笔画透明(即非黑非白的灰色)显示的风格,这给本已面临诸多困难的‘无衬底’背景的字符识别带来了新的挑战。有实验数据显示,在相同的自然场景下,使用字符笔画透明风格比不透明(纯黑色或纯白色)风格,其识别准确率下降20%以上,严重影响了方案的预期应用效果。基于深度学习技术的图像中叠加时间字符的识别算法,为了获得较理想的效果,一般都会假定应用场景的约束条件——即在图像中采用规范的、纯黑色或纯白色、非透明风格标注叠加的字符。由于透明字符固有的低对比度属性,极容易与图像的自然背景产生混淆,而变得更加不易辨认,直接影响训练模型的性能。通过实验数据分析,单纯依靠算法训练来提升笔画透明字符的识别准确率,已经遇到了瓶颈。 >
技术实现思路
...
【技术保护点】
1.一种视频图像中叠加透明时间字符的夜间成像识别方法,其特征在于,包括以下步骤:/n步骤i、改进CRNN通用文本识别网络的训练方法;/n步骤ii、制作CRNN夜间透明时间字符训练样本;/n步骤iii、引入注意力模块强化训练夜间透明时间字符识别模型;/n步骤iv、识别夜间待检图像中的透明时间字符并校验输出值的合理性。/n
【技术特征摘要】
1.一种视频图像中叠加透明时间字符的夜间成像识别方法,其特征在于,包括以下步骤:
步骤i、改进CRNN通用文本识别网络的训练方法;
步骤ii、制作CRNN夜间透明时间字符训练样本;
步骤iii、引入注意力模块强化训练夜间透明时间字符识别模型;
步骤iv、识别夜间待检图像中的透明时间字符并校验输出值的合理性。
2.根据权利要求1所述的视频图像中叠加透明时间字符的夜间成像识别方法,其特征在于,所述步骤i,改进CRNN通用文本识别网络的训练方法的具体步骤包括:
1-1)在主干ResNet分类网络的特征提取环节,采用3层采样,以保留字符的更多横向特征;
1-2)在提取字符高度特征时,使用最大值池化;
1-3)选择单层LSTM,将其输出的隐藏层向量,用于注意力向量计算。
3.根据权利要求1所述的视频图像中叠加透明时间字符的夜间成像识别方法,其特征在于,所述步骤ii,制作CRNN夜间透明时间字符训练样本的具体步骤包括:
2-1)在背景透明图像上,使用字符像素渲染函数在其上生成黑白颜色、多种字体、多种时间格式的时间字符;
2-2)使用PerlinNoise噪点图对上述时间字符笔画像素生成随机斑点;
2-3)对带有随机斑点的时间字符进行透明度处理,叠加到随机的夜间背景图像上作为训练的输入样本;
2-4)取2-1)中时间字符的文本形式,将其中非标准时...
【专利技术属性】
技术研发人员:聂晖,杨小波,李军,
申请(专利权)人:武汉东智科技股份有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。