本发明专利技术提供了一种基于位置注意力的车牌识别方法,属于车牌识别技术领域,包括:将车牌图像输入到卷积神经网络中提取特征得到特征T,使用自适应平均池化将特征T转换成特定大小的第一特征序列T1;将T1降维后得到第二特征序列z;为每个字符位置计算生成一个注意力图α
【技术实现步骤摘要】
一种基于位置注意力的车牌识别方法
[0001]本专利技术属于车牌识别
,具体涉及一种基于位置注意力的车牌识别方法。
技术介绍
[0002]车牌检测与识别系统被广泛的应用在各种生活场景中,在现在智能交通场景中起着关键作用。
[0003]现有技术中车牌识别方法是利用卷积神经网络提取车牌图像特征并进行识别。基于卷积神经网络的方法主要对训练数据进行分类和标记后,采用卷积神经网络对车牌提取特征,将得到的特征用来训练神经网络,再通过神经网络对车牌结果进行预测。
[0004]然而,该方法在预测结果时,采用的是全局所有的车牌特征,这加大了网络的训练难度,影响网络收敛的速度,一定程度上影响识别的精度。目前存在基于卷积神经网络的方法会对车牌进行字符级别的标注,该方法虽然能快速收敛并提高识别精度,但是前期标注成本巨大。
技术实现思路
[0005]为了克服上述现有技术存在的不足,本专利技术提供了一种基于位置注意力的车牌识别方法。
[0006]为了实现上述目的,本专利技术提供如下技术方案:
[0007]一种基于位置注意力的车牌识别方法,包括:
[0008]将车牌图像输入到卷积神经网络中提取特征得到特征T,使用自适应平均池化将特征T转换成特定大小的第一特征序列T1,将T1降维后得到第二特征序列z;
[0009]将第二特征序列z经过三个卷积核和三个ReLU激活函数处理得到第三特征序列K,K的特征尺寸为(1,M,512);
[0010]为车牌图像的每个字符的位置计算生成一个注意力图α
ij
,其中注意力图α
ij
表达式为:
[0011][0012]其中,
[0013]e
ij
=q
iT
k
j
+b
i
,j=1....M,
[0014]其中q
i
为训练的向量,b
i
为训练的偏移量,L是车牌中字符的最大数目,且包括一个结束符;M为第三特征序列K的列数;k
j
是第三特征序列K中第j个特征向量;
[0015]将所述注意力图α
ij
与第二特征序列z进行高维矩阵乘得到最终的图片特征c
i
,将c
i
通过神经网络进行多类别分类操作,得到车牌识别结果。
[0016]进一步,所述第二特征序列z的特征尺寸为(14,512)。
[0017]进一步,所述车牌中字符的最大数目取9。
[0018]进一步,所述图片特征c
i
表达式为:
[0019][0020]其中,zj为第二特征序列z中第j个特征向量。
[0021]进一步,所述多类别分类操作表达式为:
[0022][0023]其中ρ
ij
=P(y
i
=j∨χ),为车牌上第i个字符是字符集中第j个符号的概率;是softmax可训练的参数。
[0024]进一步,所述卷积神经网络采用Resnet18。
[0025]进一步,还包括:对车牌图像进行归一化处理,将归一化处理后的图像输入到卷积神经网络中提取特征得到特征T,所述归一化处理包括:采用归一化的方法逐通道的对图像进行标准化,各通道和均值和标准差设为为0.5。
[0026]本专利技术提供的一种基于位置注意力的车牌识别方法具有以下有益效果:
[0027]本专利技术提出了一种基于位置注意力的车牌识别方法,利用注意力图与第二特征序列z进行高维矩阵乘得到最终的图片特征c
i
,将c
i
经过神经网络进行多类别分类操作,得到车牌识别结果。此方法能够有效地的注意到每个字符的位置,并针对字符区域进行识别,且不需要经过前期的标注。解决了现有技术中,利用卷积神经网络对车牌进行字符级别的标注,前期标注成本巨大的问题。
附图说明
[0028]为了更清楚地说明本专利技术实施例及其设计方案,下面将对本实施例所需的附图作简单地介绍。下面描述中的附图仅仅是本专利技术的部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1为本专利技术实施例的一种基于位置注意力的车牌识别方法示意图;
[0030]如图2为本专利技术实施例中第二特征序列z1,z2,
…
,z
M
覆盖区域示意图;
[0031]如图3为本专利技术实施例中车牌上不同位置的字符的注意力图。
具体实施方式
[0032]为了使本领域技术人员更好的理解本专利技术的技术方案并能予以实施,下面结合附图和具体实施例对本专利技术进行详细说明。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0033]实施例:
[0034]本专利技术提供了一种基于位置注意力的车牌识别方法,具体如图1所示,包括:将车牌图像输入到卷积神经网络中提取特征得到特征T,使用自适应平均池化将特征T转换成特定大小的第一特征序列T1;将T1降维后得到第二特征序列z;将第二特征序列z经过三个卷积核和三个ReLU激活函数处理得到第三特征序列K,K的特征尺寸为(1,M,512);为每个字符
位置计算生成一个注意力图α
ij
,其中注意力图α
ij
表达式为:
[0035][0036]其中,
[0037]e
ij
=q
iT
k
j
+b
i
,j=1....M,
[0038]其中q
i
为可训练的向量,b
i
为可训练的偏移量,L是车牌中字符的最大数目,且包括一个结束符;M为第三特征序列K的列数;k
j
是第三特征序列K中第j个特征向量;
[0039]将注意力图α
ij
与第二特征序列z进行高维矩阵乘得到最终的图片特征c
i
,将c
i
通过神经网络进行多类别分类操作,得到车牌识别结果。
[0040]以下为利用本专利技术进行车牌识别的具体实施例:
[0041]步骤1:将车牌图片进行预处理,尺寸调整为(140,440),并采用归一化的方法逐通道的对图像进行标准化,各通道和均值和标准差设为为0.5。车牌号根据预先设定的各个字符的排列顺序进行编码。
[0042]步骤2:将步骤1获得的车牌图片输入到网络模型中,先经过一个卷积神经网络提取特征(本实施中采用Resnet18,也可以使用其它卷积网络),得到特征T,并使用自适应平均池化将其转换成特定大小的特征序列T
′
,后将T
′
降维为(14,512)得到z=(z1,z2,...,z
M
),M的大小为14。该序列中每个特征向量覆盖了车牌图像中的一个局部区域,如图2所示。
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于位置注意力的车牌识别方法,其特征在于,包括:将车牌图像输入到卷积神经网络中提取特征得到特征T,使用自适应平均池化将特征T转换成特定大小的第一特征序列T1,将T1降维后得到第二特征序列z;将第二特征序列z经过三个卷积核和三个ReLU激活函数处理得到第三特征序列K,K的特征尺寸为(1,M,512);为车牌图像的每个字符的位置计算生成一个注意力图α
ij
,其中注意力图α
ij
表达式为:其中,e
ij
=q
iT
k
j
+b
i
,j=1....M,其中,q
i
为训练的向量,b
i
为训练的偏移量,L是车牌中字符的最大数目,且包括一个结束符;M为第三特征序列K的列数;k
j
是第三特征序列K中第j个特征向量;将所述注意力图α
ij
与第二特征序列z进行高维矩阵乘得到最终的图片特征c
i
,将最终的图片特征c
i
通过神经网络进行多类别分类操作,得到车牌识别结果。2.根据权利要求1所述的一种基于位置注意力的车牌识别方法,...
【专利技术属性】
技术研发人员:王文中,王天祥,汤进,
申请(专利权)人:安徽大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。