System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于机器视觉的文本图像超分辨率重建方法及系统技术方案_技高网

一种基于机器视觉的文本图像超分辨率重建方法及系统技术方案

技术编号:42636015 阅读:26 留言:0更新日期:2024-09-06 01:34
本发明专利技术涉及一种基于机器视觉的文本图像超分辨率重建方法及系统,重建方法,包括如下步骤:对超分数据集进行随机噪声,随机擦除数据增强,使用增强后的数据进行模型的训练,对训练好的ESPCN模型进行剪枝率为0.2的全局剪枝以减少模型参数量;将实时视频流中的Y分量取出,并进行宽高为64*64的ROI图像截取;使用引导滤波对ROI进行平滑得到LR;用训练好的超分模型对LR进行超分辨率重建得到HR;将HR图像缩放到160*32像素进行文本字符的识别;通过以上步骤完成视频中文本内容的识别并上报给上位机。本发明专利技术不仅可以提高图像分辨率,还可以识别图像中的字符串,提高了字符识别的准确率并且减少人工识别字符的工作量。

【技术实现步骤摘要】

本专利技术涉及图像处理重建,尤其是指一种基于机器视觉的文本图像超分辨率重建方法及系统


技术介绍

1、超分辨率技术(super-resolution,sr)是指从观测到的低分辨率图像重建出相应的高分辨率图像。视频超分是通过深度学习技术,针对视频画面和场景进行分析,结合视频降噪、去模糊、锐化、去抖动等画质增强等处理,为视频场景带来更好的画质观看体验。在监控设备、卫星图像和医学影像、军事侦查等领域都有重要的应用价值。

2、在实际工程应用中,由于光学设备成像限制或场景条件的影响图像拍摄的视觉效果不佳,这就需要图像增强技术来改善人的视觉效果,比如突出图像中目标物体的某些特点、从数字图像中提取目标物的特征参数等等。如公开的专利cn111028150b一种快速时空残差注意力视频超分辨率重建方法,通过在神经网络模型中增加注意力上采样机制,将网络注意力集中于高频信息,从而得到更好的恢复结果。公开的专利cn110969577b公开了一种基于深度双重注意力网络的视频超分辨率重建方法,通过加载级联的运动补偿网络模型和重建网络模型,充分利用时空信息特征来实现精确的视频超分辨率重建。公开的专利cn111311490b公开了基于多帧融合光流的视频超分辨率重建方法,用三维尺度特征提取层和时空残差模块提取补偿帧的图像特征,并采用亚像素卷积,得到高分辨率视频帧,对多帧融合光流网络和视频超分辨率重建网络。

3、但上述专利的技术方案中均不包含对输入数据进行滤波预处理和对超分后图像文本识别的构思,故无法对于后续工作流程提供更多的信息。

<br/>

技术实现思路

1、为解决上述技术问题,本专利技术的一种基于机器视觉的文本图像超分辨率重建方法,包括如下步骤:

2、步骤s1:对超分数据集进行预处理,使用预处理后的数据进行超分网络模型的训练;

3、步骤s2:通过上位机点选完成视频流中需要进行超分的局部文本图像roi;

4、步骤s3:对roi图像进行滤波操作以突出边缘信息得到图像lr;

5、步骤s4:对滤波后的图像进行超分辨率重建得到超分后的图像hr;

6、步骤s5:通过光学字符识别算法完成hr中文本的识别;

7、步骤s6:通过以上步骤完成视频中文本内容的识别并上报给上位机。

8、优选的,所述步骤s1具体包括如下:

9、s101:对数据集中的数据进行随机噪声,随机擦除等数据增,扩充训练集的数据丰富度强,提高超分算法的鲁棒性;

10、s102:对超分算法进行结构剪枝以减少网络的参数量,确保算法在嵌入式设备上能够实时处理。

11、优选的,所述步骤s2具体包括如下:

12、s201:对解码后的视频流取出y分量;

13、s202:使用opencv新建一幅单通道图像gray,并将y中的数据拷贝到gray中;

14、s203:通过opencv完成gray中文本图像roi的扣取。。

15、优选的,所述步骤s3具体包括如下:

16、s301:通过引导滤波完成roi图像去噪,同时尽可能保留图像中的边缘信息,得到图像lr。

17、优选的,所述步骤s4具体包括如下:

18、s401:根据步骤s3得到预处理后的图像lr,通过超分辨率重建算法进行图像超分得到图像hr。

19、优选的,所述步骤s5具体包括如下:

20、s501:通过文本数据集文本识别算法模型的训练;

21、s502:对hr图像进行文本的识别。

22、优选的,所述步骤s6具体包括如下:

23、s601:根据识别结果中的文本内容,通过串口上报给上位机并进行字符信息的叠加。

24、本专利技术还提供了一种基于机器视觉的文本图像超分辨率重建系统,实现服务于的方法;其中重建系统包括:

25、图像采集及预处理模块,用于训练数据的增强和超分数据的平滑;

26、超分辨率模块,对lr文本图像进行超分辨率重建;

27、抠图模块,完成局部文本图像roi的扣取;

28、文本识别模型,通过文本识别算法对字符串进行识别;

29、传输及显示模块,将识别结果通过串口传输给上位机进行字符叠加和显示。

30、本专利技术的上述技术方案相比现有技术具有以下优点:

31、本专利技术所述的文本图像超分辨率重建方法及系统,相较于传统只是提高光学系统分辨率的方案,可以实时对感兴趣区域进行超分辨率重建,减少对光学镜头的依赖和使用成本。

32、同时相比简单的超分辨率重建提高图像分辨率,本专利技术不仅可以提高图像分辨率,还可以识别图像中的字符串,提高了整个系统字符识别的准确率并且减少人工识别字符的工作量。

本文档来自技高网
...

【技术保护点】

1.一种基于机器视觉的文本图像超分辨率重建方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤S1具体包括如下:

3.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤S2具体包括如下:

4.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤S3具体包括如下:S301:通过引导滤波完成ROI图像去噪,同时尽可能保留图像中的边缘信息,得到图像LR。

5.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤S4具体包括如下:S401:根据步骤S3得到预处理后的图像LR,通过超分辨率重建算法进行图像超分得到图像HR。

6.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤S5具体包括如下:

7.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤S6具体包括如下:S601:根据识别结果中的文本内容,通过串口上报给上位机并进行字符信息的叠加。

8.一种基于机器视觉的文本图像超分辨率重建系统,其特征在于:实现服务于权利要求1-7的任一项所述的方法;其中重建系统包括:

...

【技术特征摘要】

1.一种基于机器视觉的文本图像超分辨率重建方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤s1具体包括如下:

3.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤s2具体包括如下:

4.根据权利要求1所述的文本图像超分辨率重建方法,其特征在于:所述步骤s3具体包括如下:s301:通过引导滤波完成roi图像去噪,同时尽可能保留图像中的边缘信息,得到图像lr。

5.根据权利要求1所述的文本图像超分辨率重建方法,其特征在...

【专利技术属性】
技术研发人员:张俊吕璐位门
申请(专利权)人:中国电子科技集团公司第五十八研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1