【技术实现步骤摘要】
on Fisheye Cameras for Autonomous Driving: Dataset, Representations and Baseline [C]. In Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), January 2021: 2272
–
2280.
[0007][3] Kim H, Jung J, Paik J. Fisheye lens camera based surveillance system for wide field of view monitoring [J]. Optik, 2016, 127 (14): 5636
–
5646.
[0008][4] Qian Y, Yang M, Zhao X, et al. Oriented spatial transformer network for pedestrian detection usin
【技术保护点】
【技术特征摘要】
1.一种鱼眼镜头下中文场景文字检测与识别方法,其特征在于:包括文字检测模块和文字识别模块;所述文字检测模块用于鱼眼镜头下中文场景中的文字位置定位和形状检测;所述文字识别模块用于识别文字检测模块检测到的文字;其中:所述文字检测模块包括如下步骤:所述文字检测模块使用ResNet50提取鱼眼镜头下中文场景图像特征,按照ResNet block从低层到高层将图像特征分为b1、b2、b3和b4;所述文字检测模块使用特征金字塔处理图像特征b4、b3和b2,获得多尺度图像特征p1、p2和p3;所述文字检测模块使用空洞空间金字塔池化处理图像特征b4,并与b1在1x1卷积运算后的结果相拼接得到图像特征p4;所述文字检测模块分别使用多尺度图像特征p1、p2和p3通过3x3卷积运算获得多组薄板样条参数pred
tps
,每组参数有2(k+3)个,并按顺序取前k+3个参数作为x轴方向的参数,取后k+3个参数作为y轴方向的参数,一组薄板样条参数Q如下公式所示;;其中,薄板样条参数Q的每个坐标方向上的k+3个参数中,前k个参数用于调整径向基函数值的权重,后3个参数用于调整待进行薄板样条变换的点本身坐标值的权重;所述文字检测模块对图像特征p4上采样得到文字语义分割结果pred
seg
,它是一个二分类的语义分割结果,其上的每一个位置的值表示是否采用此处的薄板样条参数,0表示不采用,1表示采用;所述文字检测模块通过文字语义分割结果pred
seg
确定所要采...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。