【技术实现步骤摘要】
本专利技术涉及字符识别,特别是指一种低质量图像的ocr识别方法及系统。
技术介绍
1、字符识别
包含对图像中所包含字符信息的自动识别与转换处理过程,该
的核心内容包括图像获取、字符区域定位、字符特征提取、字符分类识别、识别后文本的结构重建,旨在从静态或动态图像中分离出字符信息,并转换为计算机可识别和处理的文本数据,应用场景涵盖文档数字化、票据识别、车牌识别、移动设备拍照识字等,包括使用图像增强、图像分割、模式识别、深度学习等方式完成字符提取与识别,专注于字符结构特征的稳定获取与分类模型的泛化能力。
2、其中,一种低质量图像的ocr识别方法专注于图像质量较差条件下进行字符识别处理,旨在解决图像模糊、噪声干扰严重、分辨率低或拍摄光照条件差等因素对字符识别过程造成干扰的问题,具体包括调整图像亮度分布,结合对比度拉伸增强图像灰度细节,突出字符边缘特征,提取高响应字符区域,通过区域连通性与形态结构特征分析检测字符候选区,结合连通域大小过滤非字符区域,进行粘连字符切分和字符类别预测,结合语言模型上下文概率与词典匹配机制进行识
...【技术保护点】
1.一种低质量图像的OCR识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的低质量图像的OCR识别方法,其特征在于,所述亮度调整参数包括亮度等级映射表、像素分布密度矩阵、灰度等级跃迁强度值,所述字符候选区域包括有效字符网格编号、字符网格灰度分布图、非字符区域剔除标记,所述冲突位置坐标包括边界连续性中断点位置、字符粘连交界点坐标、结构冲突斜率夹角数值,所述字符识别信息包括字符边界封闭度指数、笔画连贯性系数、字符结构可信等级。
3.根据权利要求1所述的低质量图像的OCR识别方法,其特征在于,提取图像中每个像素的亮度值,计算每个亮度等级的
...【技术特征摘要】
1.一种低质量图像的ocr识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的低质量图像的ocr识别方法,其特征在于,所述亮度调整参数包括亮度等级映射表、像素分布密度矩阵、灰度等级跃迁强度值,所述字符候选区域包括有效字符网格编号、字符网格灰度分布图、非字符区域剔除标记,所述冲突位置坐标包括边界连续性中断点位置、字符粘连交界点坐标、结构冲突斜率夹角数值,所述字符识别信息包括字符边界封闭度指数、笔画连贯性系数、字符结构可信等级。
3.根据权利要求1所述的低质量图像的ocr识别方法,其特征在于,提取图像中每个像素的亮度值,计算每个亮度等级的像素分布密度和灰度波动幅度,分析相邻亮度等级间的跃迁趋势和跃迁强度,构建亮度等级间的调整路径关系,得到亮度调整参数的步骤具体为:
4.根据权利要求3所述的低质量图像的ocr识别方法,其特征在于,调用所述亮度调整参数,调整图像亮度并划分为多个网格,提取每个网格内像素灰度的变化梯度和波动幅度,分析每个网格内灰度梯度的均匀性,根据灰度变化趋势和梯度幅度,检测非字符区域并剔除,得到字符候选区域的步骤具体为:
5.根据权利要求4所述的低质量图像的ocr识别方法,其特征在于,基于所述字符候选区域,识别区域边界并提取边界每个轮廓点的坐标位...
【专利技术属性】
技术研发人员:李杰,梁步亮,常一志,
申请(专利权)人:深圳牛图科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。