基于多分类支持向量机的集装箱箱号识别方法技术

技术编号:4023074 阅读:420 留言:0更新日期:2012-04-11 18:40
基于多分类支持向量机的集装箱箱号识别方法,属于图像处理技术领域。本发明专利技术首先采集集装箱箱号字符图像,经二值化和归一化处理后分成字母图像集和数字图像集;然后构建两个多分类支持向量机,分别采用字母图像集的特征向量矩阵和数字图像集的特征向量矩阵进行训练,得到两个多分类支持向量机分类器SVC和SVN;在箱号识别过程中,将待识别集装箱箱号分割成11个字符图像,经二值化和归一化处理后,将计算所得的第1至第4个特征向量输入到多分类支持向量机分类器SVC进行识别,第5至第11个特征向量输入到多分类支持向量机分类器SVN进行识别。本发明专利技术创新性地将支持向量机应用于集装箱箱号字符识别,相比于其他同领域的技术方案具有更高的识别率和较小的计算量。

【技术实现步骤摘要】

本专利技术属于图像处理
,涉及模式识别技术,特别涉及集装箱箱号识别方法。
技术介绍
集装箱是一种综合性的大型周转货箱,全球所有的集装箱都具有一个唯一的箱号 与之对应。集装箱箱号通常用不同于箱体本身颜色的油漆印刷于集装箱箱体两侧和后侧。 由于每个集装箱都具有一个唯一的箱号与之对应,所以对集装箱的识别就可以归结为对箱 号的识别。本专利技术中集装箱箱号识别是指利用计算机视觉技术来完成对集装箱箱号的识别。 集装箱箱号识别系统一般要求能实时识别通过卡口的集装箱箱号并通过计算机检索系统 查询集装箱的信息。通常,集装箱箱号识别方法可以分为四个过程图像采集、箱号定位、箱 号字符分割和字符识别,而如何进行精确的字符识别是影响集装箱箱号识别系统识别率高 低的一个关键问题。全球的集装箱有统一的编号标准箱号由四个大写英文字母表示公司简称,六个 阿拉伯数字表示编号,最后还有一个被框起来的数字校验位。虽然集装箱箱号识别可以借鉴现有的一些计算机字符识别方法,但集装箱箱号字 符识别具有自身的特点小字符集(数字和字母)、箱号字体没有统一的印刷标准(箱号字 体的印刷因集装箱所属公司而有所不同)、干扰和几何变形较多(如集装箱背面还存在着 很多非箱号的其他字符)、甚至出现箱号破损的情况。而且集装箱箱号字符识别要求更高的 识别率,上下文字符也没有语义和概率上的相关性。现有的计算机字符识别主要有以下几种方法1.模板匹配的方法,利用字符轮廓、骨干、网络或者投影等特征,与标准字符比对 分类。但是,由于实际应用中存在的干扰和变形,实用中常常没有很高的识别率。2.按字符特征分类的方法,找出能够区别字符集中字符的特征集,如字符像素 比例、孔洞数、字形结构、笔画特征等。由于特征算法的实现困难,而且同样由于噪声干扰的 问题,这一方法的识别率不高。3.神经网络的方法是目前比较成功的方法。但是存在输入数据选择和网络结构设 计等问题。
技术实现思路
本专利技术的目的是提供一种。本专利技术 基于多分类支持向量机,利用其良好的分类能力,直接对提取出来的字符分类,相比于其他 同领域的方案具有更高的识别率。为方便描述本
技术实现思路
,这里首先对一些术语进行必要的定义定义1.集装箱箱号。对应于全球唯一的集装箱,由4个大写英文字母和7个阿拉伯数字组成,共11个字符。其中4个字母分为箱主(经营人代码)和设备识别码两部分,7 个数字分为序号和校验码两部分。定义2.灰度图像的二值化。在灰度图像中,常采用一个字节表示一个像素点,其 灰度级为0 255,其二值化方法为构造用一个二进制位表示一个像素点的图像,设置二值 化阈值T,将大于T的像素点设置为1,小于等于T的点设为0。本专利技术技术方案如下,如图1所示,包括多分类支持向 量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程一、多分类向量机的训练过程,包括如下步骤步骤1 采集足够多的集装箱箱号字符图像;然后对集装箱箱号字符图像进行二 值化处理,并归一化成宽度为M个像素、高度为N个像素大小的尺寸。归一化后的二值化集 装箱箱号字符图像集记为图像集Train。步骤2 将步骤1所得的图像集Train分成字母图像集Train_C_I和数字图像集 Train_N_I,其中字母图像集Train_C_I包括26个子集,数字图像集Train_N_I包括10个 子集。步骤3 计算步骤2所得各个图像集中所有图像的特征向量,得到字母特征向量集 Train_C_V和数字特征向量集Train_N_V,其中字母特征向量集Train_C_V包括26个子集, 数字特征向量集Train_N_V包括10个子集。所述特征向量为一个MXN+1维的行向量,其 中前MXN维由每幅图像的灰度值按行依次排列成,第MXN+1维是区别36个子集的标签。步骤4 将字母特征向量集Train_C_V中所有特征向量组合成字母特征向量矩阵 Train_C_V_M,同时将数字特征向量集Train_N_V中所有特征向量组合成数字特征向量矩 阵 Train_N_V_M。步骤5 建立两个多分类支持向量机分类器SV。和SVN。构建两个多分类支持向量机,分别采用字母特征向量矩阵Train_C_V_M和数字特 征向量矩阵Train_N_V_M进行训练,得到两个多分类支持向量机分类器SV。和SVN。二、使用多分类支持向量机进行集装箱箱号识别的过程,具体包括以下步骤步骤6 采集待识别集装箱箱号图像,经定位、分割处理后得到11个的待识别的集 装箱箱号字符图像;再对11个待识别的集装箱箱号字符图像进行步骤1所述的二值化和归 一化处理。步骤7 计算11个归一化后的二值化待识别集装箱箱号字符图像的特征向量,并 将11个特征向量按待识别集装箱箱号字符图像在待识别集装箱箱号中的位置顺序依次定 义为Xi、X2、、…、xn。所述特征向量由每幅图像的灰度值按行依次排列成。步骤8 对11个特征向量进行分类识别。由于集装箱箱号由11个字符组成,11个字符中,前4个字符为英文字母,后7个 字符为阿拉伯数字;所以对X1 X4这4个特征向量,采用多分类支持向量机分类器SVc进 行识别,得到待识别集装箱箱号第1至第4个的标签,进而得到待识别集装箱箱号第1至第 4个字符识别结果;对X5 X11这7个特征向量,采用多分类支持向量机分类器SVn进行识 别,得到待识别集装箱箱号第5至第11个的标签,进而得到待识别集装箱箱号第5至第11 个字符识别结果。需要说明的是1、步骤1中,采集集装箱箱号字符图像时,应当在各种光照条件下采集,且保证每 种字符的采集数量在20个以上;对集装箱箱号字符图像进行二值化处理时,图像灰度等级 按255级灰度计算,二值化阈值的取值范围为;归一化后的二值化集装箱箱号字 符图像宽度M为16像素,高度N为32像素。2、本专利技术所述的多分类支持向量机,对于内核函数并没有特别的限定,但若采用 径向基核函数,会使得最终的识别准确率更高。3、考虑到多分类支持向量机的特性,本专利技术在多分类向量机的训练过程中,采集 集装箱箱号字符图像时,所采集的各种字符图像的数量应基本一致,以保证各字符平等地 参与训练,从而减少由于训练次数差异带来的识别偏差。本专利技术的有益效果是本专利技术创新性地将支持向量机应用于集装箱箱号识别,利用其良好的分类能力, 直接对提取出来的字符分类,相比于其他同领域的方案具有更高的识别率。本专利技术区别对 待集装箱箱号字符的前4位和后7位字符,将字符二值化图像特征向量分成两个集合,分别 构造两个多分类支持向量机,并在识别过程中采用不同的支持向量机对需要识别的集装箱 箱号字符进行逐一识别,大大减少了计算量。附图说明本专利技术提供的的流程示意图。 具体实施例方式,如图1所示,包括多分类支持向 量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程一、多分类向量机的训练过程,包括如下步骤步骤1 采集足够多的集装箱箱号字符图像;然后对集装箱箱号字符图像进行二 值化处理,并归一化成宽度为M个像素、高度为N个像素大小的尺寸。归一化后的二值化集 装箱箱号字符图像集记为图像集Train。步骤2 将步骤1所得的图像集Train分成字母图像集Train_C_I和数字图像集 Train_N_I,其中字母图像集Train_C_I包括26个子集,数字图像集Train_本文档来自技高网
...

【技术保护点】
基于多分类支持向量机的集装箱箱号识别方法,包括多分类支持向量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程:一、多分类向量机的训练过程,包括如下步骤:步骤1:采集足够多的集装箱箱号字符图像;然后对集装箱箱号字符图像进行二值化处理,并归一化成宽度为M个像素、高度为N个像素大小的尺寸;归一化后的二值化集装箱箱号字符图像集记为图像集Train;步骤2:将步骤1所得的图像集Train分成字母图像集Train_C_I和数字图像集Train_N_I,其中字母图像集Train_C_I包括26个子集,数字图像集Train_N_I包括10个子集;步骤3:计算步骤2所得各个图像集中所有图像的特征向量,得到字母特征向量集Train_C_V和数字特征向量集Train_N_V,其中字母特征向量集Train_C_V包括26个子集,数字特征向量集Train_N_V包括10个子集;所述特征向量为一个M×N+1维的行向量,其中前M×N维由每幅图像的灰度值按行依次排列成,第M×N+1维是区别36个子集的标签;步骤4:将字母特征向量集Train_C_V中所有特征向量组合成字母特征向量矩阵Train_C_V_M,同时将数字特征向量集Train_N_V中所有特征向量组合成数字特征向量矩阵Train_N_V_M;步骤5:建立两个多分类支持向量机分类器SV↓[C]和SV↓[N];构建两个多分类支持向量机,分别采用字母特征向量矩阵Train_C_V_M和数字特征向量矩阵Train_N_V_M进行训练,得到两个多分类支持向量机分类器SV↓[C]和SV↓[N];二、使用多分类支持向量机进行集装箱箱号识别的过程,具体包括以下步骤:步骤6:采集待识别集装箱箱号图像,经定位、分割处理后得到11个的待识别的集装箱箱号字符图像;再对11个待识别的集装箱箱号字符图像进行步骤1所述的二值化和归一化处理;步骤7:计算11个归一化后的二值化待识别集装箱箱号字符图像的特征向量,并将11个特征向量按待识别集装箱箱号字符图像在待识别集装箱箱号中的位置顺序依次定义为X↓[1]、X↓[2]、…、X↓[11];所述特征向量由每幅图像的灰度值按行依次排列成;步骤8:对11个特征向量进行分类识别;由于集装箱箱号由11个字符组成,11个字符中,前4个字符为英文字母,后7个字符为阿拉伯数字;所以对X↓[1]~X↓[4]这4个特征向量,采用多分类支持向量机分类器SV↓[C]进行识别,得到待...

【技术特征摘要】

【专利技术属性】
技术研发人员:马争解梅苏俊人
申请(专利权)人:电子科技大学
类型:发明
国别省市:90[中国|成都]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1