当前位置: 首页 > 专利查询>中南大学专利>正文

一种针对光字符识别的码率设置方法、设备及存储介质技术

技术编号:24591618 阅读:23 留言:0更新日期:2020-06-21 02:46
本发明专利技术公开了一种针对光字符识别的码率设置方法、设备及存储介质,本方法首先对图片进行下采样,其次对下采样图片进行多次编码求取使得下采样图片能够被正确识别的最优QP/Rate值(最低的码率值/量化系数值),然后根据置信度神经网络求取码率增加量M/量化系数增加量N,最后快速找到针对该原始图片的最优编码值,该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值/最低量化系数值。相较于现有技术,本发明专利技术不仅可以减少网络传输带宽,而且针对大量数以亿计的图片也可以减少存储空间的占用而减少成本。而且本发明专利技术涵盖了主流的混合编码架构的应用场景,可以采用任意一种图像编码标准或者视频编码标准的帧内编码方式,应用广泛。

A rate setting method, device and storage medium for optical character recognition

【技术实现步骤摘要】
一种针对光字符识别的码率设置方法、设备及存储介质
本专利技术涉及视频编码技术和深度学习
,特别涉及一种针对光字符识别的码率设置方法、设备及存储介质。
技术介绍
随着人工智能技术的不断发展进步,基于移动端采集数据并进行简单的处理,然后传达运动进行智能分析已经普及。其中人脸识别、光学字符识别已经得到广泛应用。大量图像的传输会耗费大量带宽,为了节省数据网络带宽,需要对图像数据进行码率(Rate)设置,图片的码率最小(从而消耗的带宽最少)且图片质量影响最小,使得光字符识别(即OCR)效果较好。另外,即使是不需要网络传输,直接在云端或本地服务器进行OCR的应用场景中,数以亿计的图片也会占用大量存储空间。为了降低图片存储空间而减少成本,也有必要通过图片快速编码的方式对图片大小进行控制,尽量采用小的码率(即图片的体积尽量小)使得不影响光字符识别效果。传统常用的图像编码方法有JPEG,JPEG2000等。近些年,视频编码标准的帧内编码方法也可用于图像编码,取得了比JPEG等传统方法更好的编码效率。其中,H.264、HEVC、VVC、AVS2、AVS3、AV1等一系列标准采用了混合编码架构,主要针对视频编码,但是它们的帧内编码也逐渐被应用在图像编码上。目前,在众多编码标准中如何保证光字符识别的准确率的前提下,尽量降低图片码率也是仍待解决的问题。
技术实现思路
本专利技术的目的在于至少解决现有技术中存在的技术问题之一,提供了一种针对光字符识别的码率设置方法、设备及存储介质。根据本专利技术的实施例,提供了一种针对光字符识别的码率设置方法,包括以下步骤:设置原始图片的Rate区间,对所述原始图片进行下采样,得到下采样图片;在所述Rate区间内求取所述下采样图片的最优Rate值,所述最优Rate值为所述Rate区间内满足以下条件的最小值:基于所述最优Rate值对所述下采样图片进行编码,并在解码后能被正确识别;将所述下采样图片输入至置信度神经网络中,并进行置信度预测,得到码率增加量M;将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值,所述n的取值满足以下条件:基于所述最优Rate值加上n个所述码率增加量M对所述原始图片进行编码,并在解码后能被正确识别、以及基于所述最优Rate值加上n+1个所述码率增加量M对所述原始图片进行编码,并在解码后不能被正确识别。本专利技术实施例提供的一种针对光字符识别的码率设置方法,至少具有以下有益效果:(1)本方法首先对图片进行下采样,其次对下采样图片进行多次编码求取使得下采样图片能够被正确识别的最优Rate值(最低的码率值),然后根据置信度神经网络求取码率增加量M,最后根据最优Rate值和码率增加量M快速找到针对该原始图片的最优编码值,该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值。相较于现有技术,本方法降低了编码的时间消耗。(2)本方法不仅可以减少网络传输带宽,而且针对大量数以亿计的图片也可以减少存储空间的占用而减少成本。(3)本方法涵盖了主流的混合编码架构的应用场景,可以采用任意一种图像编码标准或者视频编码标准的帧内编码方式,应用广泛。根据本专利技术实施例所述的一种针对光字符识别的码率设置方法,基于二分法求取所述下采样图片的最优Rate值。根据本专利技术实施例所述的一种针对光字符识别的码率设置方法,所述设置原始图片的Rate区间,包括:根据待选用的编码标准设置所述原始图片的Rate区间,或者根据所述原始图片的大小或带宽设置所述原始图片的Rate区间。根据本专利技术实施例所述的一种针对光字符识别的码率设置方法,所述原始图片进行下采样的倍数为0.25倍。根据本专利技术的实施例,提供了一种针对光字符识别的码率设置方法,包括以下步骤:设置原始图片的QP区间,对所述原始图片进行下采样,得到下采样图片;在所述QP区间内求取所述下采样图片的最优QP值,所述最优QP值为所述QP区间内所有值中满足以下条件的最小值:基于所述最优QP值对所述下采样图片进行编码,并在解码后能被正确识别;将所述下采样图片输入至置信度神经网络中,并进行置信度预测,得到量化系数增加量N;将所述最优QP值加上n个所述量化系数增加量N设置为所述原始图片的最优编码值,所述n的取值满足以下条件:基于所述最优QP值加上n个所述量化系数增加量N对所述原始图片进行编码,并在解码后能被正确识别、以及基于所述最优QP值加上n+1个所述量化系数增加量N对所述原始图片进行编码,并在解码后不能被正确识别。本专利技术实施例提供的一种针对光字符识别的码率设置方法,至少具有以下有益效果:(1)本方法首先对图片进行下采样,其次对下采样图片进行多次编码求取使得下采样图片能够被正确识别的最优QP值(最低的量化系数值),然后根据置信度神经网络求取量化系数增加量N,最后根据最优QP值和量化系数增加量N快速找到针对该原始图片的最优编码值,该最优编码值是使得原始图片的光字符识别精度不受影响的最低量化系数值。相较于现有技术,本方法降低了编码的时间消耗。(2)本方法不仅可以减少网络传输带宽,而且针对大量数以亿计的图片也可以减少存储空间的占用而减少成本。(3)本方法涵盖了主流的混合编码架构的应用场景,可以采用任意一种图像编码标准或者视频编码标准的帧内编码方式,应用广泛。根据本专利技术实施例所述的一种针对光字符识别的码率设置方法,基于二分法求取所述下采样图片的最优QP值。根据本专利技术实施例所述的一种针对光字符识别的码率设置方法,所述设置原始图片的QP区间,包括:根据待选用的编码标准设置所述原始图片的QP区间,或者根据所述原始图片的大小或带宽设置所述原始图片的QP区间。根据本专利技术实施例所述的一种针对光字符识别的码率设置方法,所述原始图片进行下采样的倍数为0.25倍。根据本专利技术的实施例,提供了一种针对光字符识别的码率设置设备,包括:至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如上述的一种针对光字符识别的码率设置方法。根据本专利技术的实施例,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述的一种针对光字符识别的码率设置方法。附图说明下面结合附图和实施例对本专利技术进一步地说明;图1为本专利技术第一实施例提供的一种针对光字符识别的码率设置方法的流程示意图;图2为图1中步骤S102的具体流程示意图;图3为本专利技术第二实施例提供的一种针对光字符识别的码率设置方法的流程示意图;图4为图2中步骤S202的具体流程示意图;图5为本专利技术第五实施例提供的一种针对光字符识别的码率设置设备的结构示意图。具体实施方式下面将结合本文档来自技高网...

【技术保护点】
1.一种针对光字符识别的码率设置方法,其特征在于,包括以下步骤:/n设置原始图片的Rate区间,对所述原始图片进行下采样,得到下采样图片;/n在所述Rate区间内求取所述下采样图片的最优Rate值,所述最优Rate值为所述Rate区间内满足以下条件的最小值:基于所述最优Rate值对所述下采样图片进行编码,并在解码后能被正确识别;/n将所述下采样图片输入至置信度神经网络中,并进行置信度预测,得到码率增加量M;/n将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值,所述n的取值满足以下条件:基于所述最优Rate值加上n个所述码率增加量M对所述原始图片进行编码,并在解码后能被正确识别、以及基于所述最优Rate值加上n+1个所述码率增加量M对所述原始图片进行编码,并在解码后不能被正确识别。/n

【技术特征摘要】
1.一种针对光字符识别的码率设置方法,其特征在于,包括以下步骤:
设置原始图片的Rate区间,对所述原始图片进行下采样,得到下采样图片;
在所述Rate区间内求取所述下采样图片的最优Rate值,所述最优Rate值为所述Rate区间内满足以下条件的最小值:基于所述最优Rate值对所述下采样图片进行编码,并在解码后能被正确识别;
将所述下采样图片输入至置信度神经网络中,并进行置信度预测,得到码率增加量M;
将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值,所述n的取值满足以下条件:基于所述最优Rate值加上n个所述码率增加量M对所述原始图片进行编码,并在解码后能被正确识别、以及基于所述最优Rate值加上n+1个所述码率增加量M对所述原始图片进行编码,并在解码后不能被正确识别。


2.根据权利要求1所述的一种针对光字符识别的码率设置方法,其特征在于,基于二分法求取所述下采样图片的最优Rate值。


3.根据权利要求2所述的一种针对光字符识别的码率设置方法,其特征在于,所述设置原始图片的Rate区间,包括:
根据待选用的编码标准设置所述原始图片的Rate区间,或者根据所述原始图片的大小或带宽设置所述原始图片的Rate区间。


4.根据权利要求1至3任一项所述的一种针对光字符识别的码率设置方法,其特征在于,所述原始图片进行下采样的倍数为0.25倍。


5.一种针对光字符识别的码率设置方法,其特征在于,包括以下步骤:
设置原始图片的QP区间,对所述原始图片进行下采样,得到下采样图片;
在所述QP区间内求取所述下采样图片的最优QP值,所述最优QP值为所述QP区间内所有值中满足以下条件的最小值:基于所述最优QP值对所述下采样图片进行编码,并在解码后能...

【专利技术属性】
技术研发人员:张昊傅枧根钟培雄
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1