一种基于深度相机的目标文本点云图像识别矫正方法技术

技术编号:32519000 阅读:31 留言:0更新日期:2022-03-02 11:19
本发明专利技术公开了一种基于深度相机的目标本文点云图像识别矫正方法。它通过深度相机获取包含文本点云图像数据,具体为:首先,采用基于统计滤波的方法进行点云去噪,利于实现文本区域的检测与提取;其次,对文本区域采用点云法向量迭代过滤的方法,求出最终平面平均法向量;最后,通过点云旋转平移方法并根据结构化点云和图像实际长宽保持一致的要求,得到矫正后的目标文本的实际长宽,即实现了目标文本对应图像的矫正。本发明专利技术限定的方法,基于深度相机,其成本低廉、算法鲁棒性高、方法简单、计算资源小、矫正效果好,且能适应不同光照、不同距离和不同拍摄角度场景。离和不同拍摄角度场景。离和不同拍摄角度场景。

【技术实现步骤摘要】
一种基于深度相机的目标文本点云图像识别矫正方法


[0001]本专利技术涉及图像处理
,具体是一种基于深度相机的目标本文点云图像识别矫正方法。

技术介绍

[0002]随着图像采集设备的大范围普及,文本识别广泛应用于各种自然场景中。然而,受到文本大小、字体和图像质量退化等因素的影响,达到高精度的识别结果仍具有极大的挑战性。同时,考虑到自然场景图像通常包含多种语言类别,这就更加大了准确识别的难度。因此,基于移动终端有限的算力,提出一种方法简单、矫正效果好的图像矫正方法十分必要。除方法本身,图像质量乃是影响文本识别准确率的最大因素。一般从三个方面来衡量图像的质量:倾斜、清晰度、歪曲。现实中采集到的文本图像可能存在倾斜、歪曲的情况,若能将其矫正为水平正直的文本,将能极大地提升后续文本识别效率。
[0003]近年来,国内外学术界、工业界提出了很多研究文本图像矫正的方案。例如:专利技术专利(专利技术人:王鑫、温凯雯等,申请号:201911117254.0,名称:文本图像矫正方法、装置、计算机设备及存储介质。)公开了一种文本图像矫正方法、装置、计本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度相机的目标文本点云图像识别矫正方法,其特征在于包括如下步骤:步骤1:记深度相机采集图像的矩形框为box1、包含目标文本的矩形框为box2,box1和box2中心点相同,且box1包含box2;其中,box2的宽度和高度分别记为w和h;步骤2:使用深度相机获取box2包含的点云和box1包含的RGB图像,其中,box2包含的点云记为集合P={A
i
=(x
i
,y
i
,z
i
)|i=1,2,...,n},box1包含的图像记为Q,深度相机出厂时给定的内参矩阵为I;其中,A
i
表示box2包含的第i个点云,(x
i
,y
i
,z
i
)表示第i个点云的三维坐标,n表示box2包含的点云数量;步骤3:根据式(1)计算得到图像Q的像素点坐标与P中的点云坐标对应关系;k=y*w+x
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,(x,y)表示图像Q的任意像素点的坐标,k表示(x,y)对应于点云集合P中点云的下标,即(x,y)对应于A
k
=<x
k
,y
k
,z
k
>,k∈{1,2,

,n};步骤4:根据字符检测算法计算得到仅包含目标字符串的包络矩形框,记为box3,并从左上角开始按顺时针方向记录box3的4个顶点为B
a1
、B
a2
、B
a3
和B
a4
;利用式(1)找到B
a1
、B
a2
、B
a3
和B
a4
对应的点云,分别记为A
b1
、A
b2
、A
b3
和A
b4
;按顺时针连接A
b1
、A
b2
、A
b3
和A
b4
四个点云,从集合P中分割出对应于box3的点云并构成点云集合P0,根据式(2)得到点云集合P0的形心O
p
;其中,(x
c
,y
c
,z
c
)表示点云集合P0的形心O
p
的坐标,(x
b1
,y
b1
,z
b1
)、(x
b2
,y
b2
,z
b2
)、(x
b3
,y
b3
,z
b3
)和(x
b4
,y
b4
,z
b4
)分别表示A
b1
、A
b2
、A
b3
和A
b4
的坐标;步骤5:以点...

【专利技术属性】
技术研发人员:高飞王英杰卢书芳翁立波
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1