【技术实现步骤摘要】
一种金属表面弯曲文本定位及文本线拟合方法
本专利技术涉及图像定位、文本线拟合
,具体涉及一种金属表面弯曲文本定位及文本线拟合方法。
技术介绍
金属件表面文本行除直线排列以外还有倾斜排列和弯曲排列,非直线排列文本行会给字符分割带来困难,导致识别错误。针对弯曲文本进行矫正是克服上述困难的方法之一,其前置步骤就是定位弯曲文本并提取文本线。目前针对弯曲文本区域定位的方法一般分为字符级和文本行级。Tian等(荷兰,2016)提出了名为CTPN的深度神经网络模型,CTPN基于文本行一般以水平长矩形的形式存在这一先验条件,提出先检测文本行的局部并预测文本竖直方向上的位置,然后将属于同一文本行的小文本行分别合并得到完整的文本行。白翔等(华中科技大学,2017)在已有的检测方法基础之上,提出了基于SSD的水平文本检测方法,名为TextBoxes以及进一步针对任意倾斜方向文本的TextBoxes++检测方法,这类方法通过修改SSD卷积核尺寸成长条形卷积核,以尽可能的接近文本行形状,并通过此举取得优秀的检测效果。周新宇等(旷世科技, ...
【技术保护点】
1.一种金属表面弯曲文本定位及文本线拟合方法,其特征在于,包括如下步骤:/n步骤1:数据集准备及训练,具体为:/n步骤1.1:采集压力容器表面视频数据集,经过筛选得到实际生产环境下的视频帧图像样本集,通过颜色变化、亮度变化和噪点变化方式对样本集进行扩充,按照1:4的比例将样本集分为训练集和测试集,使用标签标注程序对样本集中的所有文字对象统一标注为一类;/n步骤1.2:统一将图像分辨率调为800*600作为网络输入分辨率,初始化深度卷积神经网络参数训练模型,反复比较确定最优的训练迭代周期和学习率,得到文字检测模型;/n步骤2:获取检测框中心点:使用文字检测模型对金属表面的每个 ...
【技术特征摘要】
1.一种金属表面弯曲文本定位及文本线拟合方法,其特征在于,包括如下步骤:
步骤1:数据集准备及训练,具体为:
步骤1.1:采集压力容器表面视频数据集,经过筛选得到实际生产环境下的视频帧图像样本集,通过颜色变化、亮度变化和噪点变化方式对样本集进行扩充,按照1:4的比例将样本集分为训练集和测试集,使用标签标注程序对样本集中的所有文字对象统一标注为一类;
步骤1.2:统一将图像分辨率调为800*600作为网络输入分辨率,初始化深度卷积神经网络参数训练模型,反复比较确定最优的训练迭代周期和学习率,得到文字检测模型;
步骤2:获取检测框中心点:使用文字检测模型对金属表面的每个字符进行检测,得到每个字符的检测框,并对每个检测框计算中心点pi,得到点集A,A={pi|i=1,2...,n},n表示点集A中检测框中心点的个数;
步骤3:扩充聚类点集:
步骤3.1:初步扩充点集:对点集A增加点pil和pir,得到新的点集A,其中,pil和pir分别表示第i个检测框左、右边缘的中点;
步骤3.2:采用DBSCAN方法进行聚类:聚类时将Eps设置为检测框的平均宽度MinPts设置为2,得到聚类簇集合B={Hj|j=1,2,...,v},其中,Hj表示B中的第j个聚类簇,v为B中聚类簇的个数,Eps表示扫描半径,MinPts表示最小包含点数;
步骤3.3:组合字符端部延伸:对Hj计算两端末尾处相邻两个检测框中心点的斜率,分别记为kleft和kright;从聚类簇Hj左右最末端的检测框中心点ci出发依据斜率kleft和kright延伸,延伸长度为一个将延伸点添加到点集A中,如果ci是聚类簇Hj的最左点,则Pe表示的扩展...
【专利技术属性】
技术研发人员:高飞,葛逸凡,虞雪芬,程茂,殳宏,王晓东,
申请(专利权)人:浙江工业大学,浙江省特种设备科学研究院,浙江威能消防器材股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。