一种金属表面弯曲文本定位及文本线拟合方法技术

技术编号：26479423 阅读：23 留言：0更新日期：2020-11-25 19:24

本发明专利技术公开了一种金属表面弯曲文本定位及文本线拟合方法，具体包括：训练基于深度卷积神经网络的字符检测模型；获取字符检测框中心点；采用代数方法、聚类算法等方式扩充点集；采用基于最小二乘法的曲线拟合方法拟合文本曲线。该方法对金属件表面平直、倾斜或弯曲文本都有很好的定位与拟合效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种金属表面弯曲文本定位及文本线拟合方法
本专利技术涉及图像定位、文本线拟合
，具体涉及一种金属表面弯曲文本定位及文本线拟合方法。
技术介绍
金属件表面文本行除直线排列以外还有倾斜排列和弯曲排列，非直线排列文本行会给字符分割带来困难，导致识别错误。针对弯曲文本进行矫正是克服上述困难的方法之一，其前置步骤就是定位弯曲文本并提取文本线。目前针对弯曲文本区域定位的方法一般分为字符级和文本行级。Tian等(荷兰，2016)提出了名为CTPN的深度神经网络模型，CTPN基于文本行一般以水平长矩形的形式存在这一先验条件，提出先检测文本行的局部并预测文本竖直方向上的位置，然后将属于同一文本行的小文本行分别合并得到完整的文本行。白翔等(华中科技大学，2017)在已有的检测方法基础之上，提出了基于SSD的水平文本检测方法，名为TextBoxes以及进一步针对任意倾斜方向文本的TextBoxes++检测方法，这类方法通过修改SSD卷积核尺寸成长条形卷积核，以尽可能的接近文本行形状，并通过此举取得优秀的检测效果。周新宇等(旷世科技，...

【技术保护点】
1.一种金属表面弯曲文本定位及文本线拟合方法，其特征在于，包括如下步骤：/n步骤1：数据集准备及训练，具体为：/n步骤1.1：采集压力容器表面视频数据集，经过筛选得到实际生产环境下的视频帧图像样本集，通过颜色变化、亮度变化和噪点变化方式对样本集进行扩充，按照1：4的比例将样本集分为训练集和测试集，使用标签标注程序对样本集中的所有文字对象统一标注为一类；/n步骤1.2：统一将图像分辨率调为800*600作为网络输入分辨率，初始化深度卷积神经网络参数训练模型，反复比较确定最优的训练迭代周期和学习率，得到文字检测模型；/n步骤2：获取检测框中心点：使用文字检测模型对金属表面的每个字符进行检测，得到每...

【技术特征摘要】
1.一种金属表面弯曲文本定位及文本线拟合方法，其特征在于，包括如下步骤：
步骤1：数据集准备及训练，具体为：
步骤1.1：采集压力容器表面视频数据集，经过筛选得到实际生产环境下的视频帧图像样本集，通过颜色变化、亮度变化和噪点变化方式对样本集进行扩充，按照1：4的比例将样本集分为训练集和测试集，使用标签标注程序对样本集中的所有文字对象统一标注为一类；
步骤1.2：统一将图像分辨率调为800*600作为网络输入分辨率，初始化深度卷积神经网络参数训练模型，反复比较确定最优的训练迭代周期和学习率，得到文字检测模型；
步骤2：获取检测框中心点：使用文字检测模型对金属表面的每个字符进行检测，得到每个字符的检测框，并对每个检测框计算中心点pi，得到点集A，A＝{pi|i＝1,2...,n}，n表示点集A中检测框中心点的个数；
步骤3：扩充聚类点集：
步骤3.1：初步扩充点集：对点集A增加点pil和pir，得到新的点集A，其中，pil和pir分别表示第i个检测框左、右边缘的中点；
步骤3.2：采用DBSCAN方法进行聚类：聚类时将Eps设置为检测框的平均宽度MinPts设置为2，得到聚类簇集合B＝{Hj|j＝1,2,...,v}，其中，Hj表示B中的第j个聚类簇，v为B中聚类簇的个数，Eps表示扫描半径，MinPts表示最小包含点数；
步骤3.3：组合字符端部延伸：对Hj计算两端末尾处相邻两个检测框中心点的斜率，分别记为kleft和kright；从聚类簇Hj左右最末端的检测框中心点ci出发依据斜率kleft和kright延伸，延伸长度为一个将延伸点添加到点集A中，如果ci是聚类簇Hj的最左点，则Pe表示的扩展...

【专利技术属性】
技术研发人员：高飞，葛逸凡，虞雪芬，程茂，殳宏，王晓东，
申请(专利权)人：浙江工业大学，浙江省特种设备科学研究院，浙江威能消防器材股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人