一种基于核超限学习机的快速交通标识检测方法技术

技术编号:15640396 阅读:63 留言:0更新日期:2017-06-16 05:39
本发明专利技术公开了一种基于核超限学习机的快速交通标识检测方法,属于图像信号处理及模式识别领域。首先,首先,读取原始样本图像,利用基于BING的objectness方法,产生可能包含交通标识的区域,提取候选区域的HOG特征,送入核超限学习机分类器中,得到最后的检测结果;本发明专利技术摒弃传统的滑动窗口扫描方法,使用BING算法减少搜索空间,提高检测速度。传统的ELM算法是单隐层结构,在分析复杂信号方面有很大的局限性,本发明专利技术采取KELM进行分类检测,核超限学习机可以使学习模型更加稳定、泛化性能更强,提升了检测性能,并且保持了ELM低耗时的优势。

【技术实现步骤摘要】
一种基于核超限学习机的快速交通标识检测方法
本专利技术属于图像信号处理及模式识别领域,涉及一种应用二值化规范梯度(BING)及核超限学习机进行快速交通标识检测的方法。
技术介绍
当今社会,随着经济的发展,人们生活水平日益提高,私家车的数量日益增多。与此同时,城市道路交通安全问题亦日益严峻,于是智能交通系统应运而生并快速发展。智能交通系统包括汽车导航系统、碰撞预警系统、交通标识识别系统(TrafficSignRecognitionSystem,TSR)以及其他智能化系统。前两个系统已普及应用,而TSR目前还未达到实际应用的水平。无论实际驾驶还是无人驾驶,都对TSR系统有着极高的要求。因在自然场景下受到复杂背景、天气、光照、汽车速度等的影响,交通标识检测作为TSR的一部分,其实时性和准确性尚不能满足实际应用的要求。这就亟需提出一种能满足自然场景下交通标识检测应用的方法。目前,多数交通标识的检测的研究都是基于简单背景交通标识图像的处理,然而,实际环境中包含了大量的复杂背景,这会直接影响到系统的检测效果。由于交通标识通常具有特殊的颜色和形状,很多学者针对这两种特性,提出了许多不同的检测方法。具体可以分为3类:①基于颜色信息分割的方法;②基于形状分割的方法;③基于机器学习和分类器的分割方法。然而这类基于机器学习和分类器的算法训练成本很高,很难满足自然条件下实时检测交通标志的要求。且此类方法采用传统的穷举式滑动窗口扫描方法,其搜索空间更大,计算机量更大,使得检测速度大大减慢。故本专利技术摒弃传统的滑动窗口扫描方法,使用BING算法减少搜索空间,在特定尺度下进行固定窗口大小扫描,这使得保持较高召回率的同时减少了运算量,提升了检测速度。Huang提出基于单隐层前馈神经网络(Single-hiddenLayerFeedforwardNeuralNetwork,SLFN)的超限学习机(ExtremeLearningMachine,ELM)方法,其训练速度与BP神经网络以及支持向量机(SVM)相比有明显提升。在此基础上,针对ELM自身因输入层权值随机产生等引起的风险问题,引入SVM核映射的思想,Huang等人提出了核超限学习机(KELM)。核超限学习机可以使学习模型更加稳定、泛化性能更强,提升了检测性能。本专利技术将BING及KELM相结合,旨在通过结合两者的优势使自然场景下的交通标识检测速度有所提升,检测结果更加精确。
技术实现思路
本专利技术采用一种基于二值化规范梯度和核超限学习机进行自然条件下交通标识检测的方法,对自然条件下交通场景进行检测,提高其检测准确率和检测速度。实现本专利技术方法的主要思路是:首先,读取原始样本图像,利用基于BING的objectness方法,筛选出可能包含交通标识的候选区域,根据阈值提取相应候选区域的HOG特征,送入核超限学习机分类器中,得到最后的检测结果;基于核超限学习机的快速交通标识检测方法,包括以下步骤:步骤一,读取原始样本图像,将原图像缩放到预定义大小(36种不同尺寸),计算图像的规范梯度(NormedGradient,NG)特征,对NG特征进行二值化处理,得到BING特征映射图;步骤二,利用8*8大小的滑动窗口扫描步骤一得到的BING特征映射图;步骤三,利用第一级SVM线性模型计算步骤二得到的所有窗口的滤波分数,分数越高,包含物体的概率越大;步骤四,根据步骤三得到的分数,在每一预定义尺寸下使用非极大值抑制方法选择部分窗口作为包含物体的候选窗口,使用第二级SVM线性模型计算所有候选窗口的物体分数;步骤五,根据物体分数对窗口进行排序,选取分数高于一定阈值的窗口作为物体区域,并对这些窗口提取HOG特征,输入到核超限学习机中进行分类,得到检测结果。与现有技术相比,本专利技术的方法具有以下优点:本专利技术摒弃传统的滑动窗口扫描方法,使用BING算法减少搜索空间,提高检测速度。传统的ELM算法是单隐层结构,在分析复杂信号方面有很大的局限性,本专利技术采取KELM进行分类检测,核超限学习机可以使学习模型更加稳定、泛化性能更强,提升了检测性能,并且保持了ELM低耗时的优势。附图说明图1是本专利技术所涉及方法的主流程图。图2是本专利技术所涉及的KELM分类方法示意图。具体实施方式下面结合附图1-2和具体实施方式对本专利技术做进一步的说明。假设有训练数据集TrainData和一组测试数据集TestData,TrainData的样本量为N,每个样本均包含交通标识,已知交通标识的Ground-truth;TestData的样本量为M,其中有不包含交通标识的样本;其中TrainData与TestData中样本属于K个类别;基于核超限学习机的快速交通标识检测方法,流程图如图1所示。步骤一,分别读取TrainData和TestData中的原始样本图像,将原图像缩放到预定义大小(36种不同尺度);在不同尺度下计算图像的NG特征,每一点梯度均标准化到[0,255]之间;对NG特征进行二值化处理,得到Btraindata以及BtestData。步骤二,利用8*8大小的滑动窗口扫描步骤一得到的BtestData,得到64维大小的BING特征作为BTestfeature;然后利用8*8大小的滑动窗口扫描步骤一得到的Btraindata,当扫描框跟Ground-truth的重合率大于0.5的时候,重合率即扫描框与Ground-truth的交集面积除以其并集面积,则该样本为正样本数据;反之为负样本数据。统计不同尺度下的正样本个数,并剔除正样本个数少的尺度下所有样本;得到所有剩余样本的64维BING特征作为BTrainfeature。将正样本的BING特征进行水平翻转,同时添加进BTrainfeature中。步骤三,用步骤二得到的BTrainfeature进行第一级SVM线性模型训练。利用训练得到的第一级SVM线性模型分别计算步骤二得到的BTestfeature各个窗口的滤波分数,计算公式为:sl=<ω,gl>(1)l=(i,x,y)(2)其中:sl为滤波分数;gl为NG特征;l为窗口位置;i为预定义尺度;(x,y)为窗口坐标步骤四,训练第二级SVM线性模型时,首先得到BTrainfeature在原始图像中对应的方框,该方框为可能目标框。然后,将不同尺度下对应的可能目标框根据重合率划分为正负样本。按照尺度,将BTrainfeature的正负样本重新划分为{BTrainfeature1,BTrainfeature2,…,BTrainfeature36},并分别在不同尺度下,用BTrainfeaturei进行第二级SVM线性模型训练,得到训练模型υi。根据步骤三得到的BTestfeature所对应的滤波分数,在每一预定义尺寸下使用非极大值抑制算法选择部分窗口作为包含物体的候选窗口,使用第二级SVM线性模型计算所有候选窗口的物体分数;每一尺寸下物体分数的计算公式如下:ol=υi·sl+ti(3)其中:υi为线性模型;ti为偏差项。步骤五,根据物体分数对窗口进行排序,选取分数高于一定阈值的窗口作为物体区域,并分别提取物体区域在TestData中所对应窗口位置的HOG特征作为TestFeature。针对TrainData,根据重合率随机采集总样本量为W的正负本文档来自技高网
...
一种基于核超限学习机的快速交通标识检测方法

【技术保护点】
一种基于核超限学习机的快速交通标识检测方法,其特征在于:首先,读取原始样本图像,利用基于BING的objectness方法,筛选出可能包含交通标识的候选区域,根据阈值提取相应候选区域的HOG特征,送入核超限学习机分类器中,得到最后的检测结果;基于核超限学习机的快速交通标识检测方法,包括以下步骤:步骤一,读取原始样本图像,将原图像缩放到预定义大小,计算图像的规范梯度特征即NG特征,对NG特征进行二值化处理,得到BING特征映射图;步骤二,利用8*8大小的滑动窗口扫描步骤一得到的BING特征映射图;步骤三,利用第一级SVM线性模型计算步骤二得到的所有窗口的滤波分数,分数越高,包含物体的概率越大;步骤四,根据步骤三得到的分数,在每一预定义尺寸下使用非极大值抑制算法选择部分窗口作为包含物体的候选窗口,使用第二级SVM线性模型计算所有候选窗口的物体分数;步骤五,根据物体分数对窗口进行排序,选取分数高于一定阈值的窗口作为物体区域,并对这些窗口提取HOG特征,输入到核超限学习机中进行分类,得到检测结果。

【技术特征摘要】
1.一种基于核超限学习机的快速交通标识检测方法,其特征在于:首先,读取原始样本图像,利用基于BING的objectness方法,筛选出可能包含交通标识的候选区域,根据阈值提取相应候选区域的HOG特征,送入核超限学习机分类器中,得到最后的检测结果;基于核超限学习机的快速交通标识检测方法,包括以下步骤:步骤一,读取原始样本图像,将原图像缩放到预定义大小,计算图像的规范梯度特征即NG特征,对NG特征进行二值化处理,得到BING特征映射图;步骤二,利用8*8大小的滑动窗口扫描步骤一得到的BING特征映射图;步骤三,利用第一级SVM线性模型计算步骤二得到的所有窗口的滤波分数,分数越高,包含物体的概率越大;步骤四,根据步骤三得到的分数,在每一预定义尺寸下使用非极大值抑制算法选择部分窗口作为包含物体的候选窗口,使用第二级SVM线性模型计算所有候选窗口的物体分数;步骤五,根据物体分数对窗口进行排序,选取分数高于一定阈值的窗口作为物体区域,并对这些窗口提取HOG特征,输入到核超限学习机中进行分类,得到检测结果。2.根据权利要求1所述的一种基于核超限学习机的快速交通标识检测方法,其特征在于:假设有训练数据集TrainData和一组测试数据集TestData,TrainData的样本量为N,每个样本均包含交通标识,已知交通标识的Ground-truth;TestData的样本量为M,其中有不包含交通标识的样本;其中TrainData与TestData中样本属于K个类别;基于核超限学习机的快速交通标识检测方法,步骤一,分别读取TrainData和TestData中的原始样本图像,将原图像缩放到预定义大小;在不同尺度下计算图像的NG特征,每一点梯度均标准化到[0,255]之间;对NG特征进行二值化处理,得到Btraindata以及BtestData;步骤二,利用8*8大小的滑动窗口扫描步骤一得到的BtestData,得到64维大小的BING特征作为BTestfeature;然后利用8*8大小的滑动窗口扫描步骤一得到的Btraindata,当扫描框跟Ground-truth的重合率大于0.5的时候,则该样本为正样本数据;反之为负样本数据;统计不同尺度下正样本个数,并剔除正样本个数少的尺度下所有样本;得到所有剩余样本的64维BING特征作为BTrainfeature;将正样本的BING特征进行水平翻转,同时添加进BTrainfeature中;步骤三,用步骤二得到的BTrainfeature进行第一级SVM线性模型训练;利用训练得到的第一级SVM线性模型分别计算步骤二得到的BTestfeature各个窗口的滤波分数,计算公式为:sl=<ω,gl>(1)l=(i,x,y)(2)其中:sl为滤波分数;gl为NG特征;l为窗口位置;i为预定义尺度;(x,y)为窗口坐标步骤四,训练第二级SVM线性模型时,首先得到BTrainfeature在原始图像中对应的方框,该方框为可能目标框;然后,将不同尺度下对应的可能目标框根据重合率划分为正负样本;按照尺度,将B...

【专利技术属性】
技术研发人员:段立娟王聪聪苗军马伟乔元华
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1