一种针对光字符识别的码率设置方法、设备及存储介质技术

技术编号：24591618 阅读：23 留言：0更新日期：2020-06-21 02:46

本发明专利技术公开了一种针对光字符识别的码率设置方法、设备及存储介质，本方法首先对图片进行下采样，其次对下采样图片进行多次编码求取使得下采样图片能够被正确识别的最优QP/Rate值(最低的码率值/量化系数值)，然后根据置信度神经网络求取码率增加量M/量化系数增加量N，最后快速找到针对该原始图片的最优编码值，该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值/最低量化系数值。相较于现有技术，本发明专利技术不仅可以减少网络传输带宽，而且针对大量数以亿计的图片也可以减少存储空间的占用而减少成本。而且本发明专利技术涵盖了主流的混合编码架构的应用场景，可以采用任意一种图像编码标准或者视频编码标准的帧内编码方式，应用广泛。

A rate setting method, device and storage medium for optical character recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种针对光字符识别的码率设置方法、设备及存储介质
本专利技术涉及视频编码技术和深度学习
，特别涉及一种针对光字符识别的码率设置方法、设备及存储介质。
技术介绍
随着人工智能技术的不断发展进步，基于移动端采集数据并进行简单的处理，然后传达运动进行智能分析已经普及。其中人脸识别、光学字符识别已经得到广泛应用。大量图像的传输会耗费大量带宽，为了节省数据网络带宽，需要对图像数据进行码率(Rate)设置，图片的码率最小(从而消耗的带宽最少)且图片质量影响最小，使得光字符识别(即OCR)效果较好。另外，即使是不需要网络传输，直接在云端或本地服务器进行OCR的应用场景中，数以亿计的图片也会占用大量存储空间。为了降低图片存储空间而减少成本，也有必要通过图片快速编码的方式对图片大小进行控制，尽量采用小的码率(即图片的体积尽量小)使得不影响光字符识别效果。传统常用的图像编码方法有JPEG，JPEG2000等。近些年，视频编码标准的帧内编码方法也可用于图像编码，取得了比JPEG等传统方法更好的编码效率。其中，H.264、HEVC、VVC、AVS2、AVS3、AV1等一系列标准采用了混合编码架构，主要针对视频编码，但是它们的帧内编码也逐渐被应用在图像编码上。目前，在众多编码标准中如何保证光字符识别的准确率的前提下，尽量降低图片码率也是仍待解决的问题。
技术实现思路
本专利技术的目的在于至少解决现有技术中存在的技术问题之一，提供了一种针对光字符识别的码率设置方法、设备及存储介质。根据本专利技术的实施例...

【技术保护点】
1.一种针对光字符识别的码率设置方法，其特征在于，包括以下步骤：/n设置原始图片的Rate区间，对所述原始图片进行下采样，得到下采样图片；/n在所述Rate区间内求取所述下采样图片的最优Rate值，所述最优Rate值为所述Rate区间内满足以下条件的最小值：基于所述最优Rate值对所述下采样图片进行编码，并在解码后能被正确识别；/n将所述下采样图片输入至置信度神经网络中，并进行置信度预测，得到码率增加量M；/n将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值，所述n的取值满足以下条件：基于所述最优Rate值加上n个所述码率增加量M对所述原始图片进行编码，并在解码后能被正确识别、以及基于所述最优Rate值加上n+1个所述码率增加量M对所述原始图片进行编码，并在解码后不能被正确识别。/n

【技术特征摘要】
1.一种针对光字符识别的码率设置方法，其特征在于，包括以下步骤：
设置原始图片的Rate区间，对所述原始图片进行下采样，得到下采样图片；
在所述Rate区间内求取所述下采样图片的最优Rate值，所述最优Rate值为所述Rate区间内满足以下条件的最小值：基于所述最优Rate值对所述下采样图片进行编码，并在解码后能被正确识别；
将所述下采样图片输入至置信度神经网络中，并进行置信度预测，得到码率增加量M；
将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值，所述n的取值满足以下条件：基于所述最优Rate值加上n个所述码率增加量M对所述原始图片进行编码，并在解码后能被正确识别、以及基于所述最优Rate值加上n+1个所述码率增加量M对所述原始图片进行编码，并在解码后不能被正确识别。

2.根据权利要求1所述的一种针对光字符识别的码率设置方法，其特征在于，基于二分法求取所述下采样图片的最优Rate值。

3.根据权利要求2所述的一种针对光字符识别的码率设置方法，其特征在于，所述设置原始图片的Rate区间，包括：
根据待选用的编码标准设置所述原始图片的Rate区间，或者根据所述原始图片的大小或带宽设置所述原始图片的Rate区间。

4.根据权利要求1至3任一项所述的一种针对光字符识别的码率设置方法，其特征在于，所述原始图片进行下采样的倍数为0.25倍。

5.一种针对光字符识别的码率设置方法，其特征在于，包括以下步骤：
设置原始图片的QP区间，对所述原始图片进行下采样，得到下采样图片；
在所述QP区间内求取所述下采样图片的最优QP值，所述最优QP值为所述QP区间内所有值中满足以下条件的最小值：基于所述最优QP值对所述下采样图片进行编码，并在解码后能...

【专利技术属性】
技术研发人员：张昊，傅枧根，钟培雄，
申请(专利权)人：中南大学，
类型：发明
国别省市：湖南;43

全部详细技术资料下载我是这个专利的主人