一种基于改进FRST结合卷积神经网络的瞳孔定位方法和系统技术方案

技术编号:36159222 阅读:12 留言:0更新日期:2022-12-31 20:06
本发明专利技术提出了一种基于改进FRST结合卷积神经网络的瞳孔定位方法和系统,属于图像处理和计算机视觉领域。首先基于瞳孔定位的快速径向对称变换改进方法(FRSTFPL)对图像中的瞳孔进行大致定位,接着再接入浅层卷积神经网络(CNN)实现精准定位。结果表明,本发明专利技术提出的方法在尺寸为640

【技术实现步骤摘要】
一种基于改进FRST结合卷积神经网络的瞳孔定位方法和系统


[0001]本专利技术涉及图像处理和计算机视觉领域,具体涉及一种基于改进快速径向对称变换结合卷积神经网络的瞳孔定位方法。

技术介绍

[0002]瞳孔定位广泛应用于生物识别、视线追踪、情感识别、眼病检测等领域,具有重要的研究意义。现有的瞳孔定位方法可以分为两类,分别是基于图像处理的方法和基于统计学习的方法。总的来说,基于图像处理的方法对图像特征的针对性强,定位精度较高,但鲁棒性和泛化性较差,需要人工调整参数;基于统计学习的方法定位速度快,自动化程度高,鲁棒性和泛化性较好,但对样本数量存在要求,且定位精度较低。
[0003]快速径向对称变换(FRST)是一种基于像素梯度的兴趣点检测算法,从算法本身及算法作用于瞳孔定位的角度出发,FRST主要有以下3点局限:
[0004](1)自动化程度与定位精准度无法兼得;
[0005](2)归一化因子设置不当;
[0006](3)亮对称检测对瞳孔定位造成负面影响。

技术实现思路

[0007]为了克服上述问题,本专利技术对快速径向对称变换(FRST)算法进行了改进,提出了一种用于瞳孔定位的FRSTFPL方法,并结合人眼图像的特征,进一步提出了一种基于改进FRST结合卷积神经网络的瞳孔定位方法和系统,实现了瞳孔定位方法在具有高效自动化、强鲁棒性与泛化性的同时拥有较高的定位精度。
[0008]为此,本专利技术采用以下技术方案:
[0009]第一方面,本专利技术公开了一种基于改进FRST结合卷积神经网络的瞳孔定位方法,包括如下步骤:
[0010]S1:利用快速径向对称变换改进方法对人眼输入图像中的像素进行处理,得到在固定半径范围内的瞳孔粗定位图像;
[0011]S2:利用浅层卷积神经网络对步骤S1得到瞳孔粗定位图像进行精确定位,得到最终的瞳孔定位结果。
[0012]进一步地,步骤S1所述的快速径向对称变换改进方法包括如下步骤:
[0013]S1

1:对于人眼输入图像中的像素p,将沿其梯度g(p)方向半径距离为n的像素变换为正投影像素P
+ve
(p),变换过程为:
[0014][0015]其中,表示g(p)表示像素点p的梯度幅值,round(*)表示将所求值四舍五入为整数,‖*‖表示求范数;
[0016]S1

2:根据步骤S1

1得到的正投影像素P
+ve
(p),生成梯度方向投影矩阵O
n
和梯度
幅值投影矩阵M
n

[0017]S1

3:根据步骤S1

2得到的梯度方向投影矩阵O
n
和梯度幅值投影矩阵M
n
,生成图像在单个输入半径n下的径向对称中心矩阵S
n
,计算过程如下:
[0018][0019]S
n
=F
n
*A
n
[0020]其中,F
n
(p)为输入半径n下的像素点p的径向对称特征,F
n
为输入半径n下全部像素点的径向对称特征,α为径向程度参数,A
n
为二维高斯核函数,max(*)为求最大值函数,M
n
(p)为梯度幅值投影矩阵中对应像素点p位置的值;
[0021]S1

4:根据步骤S1

3得到的径向对称中心矩阵S
n
,对所有输入半径距离n下的径向对称中心矩阵S
n
累加并求均值,得到均值径向对称中心矩阵计算过程如下:
[0022][0023]其中,|N|为半径范围N中半径距离n的个数。
[0024]S1

5:根据步骤S1

4得到的均值径向对称中心矩阵进行归一化处理,得到在固定半径范围内瞳孔的粗定位图像S。
[0025]进一步地,步骤S1

5中对均值径向对称中心矩阵进行归一化处理过程如下:
[0026][0027]其中,为均值径向对称中心矩阵中对应像素点p位置的值,所有像素点对应的值构成最后的变换结果S,即粗定位图像;S(p)为归一化后的均值径向对称中心矩阵中对应像素点p位置的值,min(*)为求最小值函数,max(*)为求最大值函数。
[0028]进一步地,步骤S1

2中,所述梯度方向投影矩阵O
n
的生成方法为:初始化梯度方向投影矩阵O
n
为0矩阵,对于人眼输入图像的每个像素点的正投影像素,分别在O
n
中将该正投影像素位置对应的数值+1,直至遍历人眼输入图像中的所有像素点;
[0029]所述梯度幅值投影矩阵M
n
的生成方法为:初始化梯度幅值投影矩阵M
n
为0矩阵,对于人眼输入图像的每个像素点的正投影像素,分别在M
n
中将该正投影像素位置对应的数值+‖g(p)‖,直至遍历人眼输入图像中的所有像素点。
[0030]进一步地,步骤S2所述浅层卷积神经网络包含一个卷积核大小为5
×
5和卷积核个数为64的第一卷积层、一个卷积核大小为4
×
4和卷积核个数为128的第二卷积层、一个卷积核大小为4
×
4和卷积核个数为256的第三卷积层以及一个全连接神经网络层;所述第一卷积层、第二卷积层、第三卷积层和全连接神经网络层串联。
[0031]进一步地,所述浅层卷积神经网络在训练过程中,人眼输入图像需要预先标注瞳孔真实位置,首先利用快速径向对称变换改进方法对人眼输入图像进行瞳孔粗定位,再利用瞳孔粗定位图像训练浅层卷积神经网络,以范数L1作为损失函数。
[0032]第二方面,本专利技术公开了一种用于实现上述基于改进FRST结合卷积神经网络的瞳孔定位方法的瞳孔定位系统,包括:
[0033]瞳孔粗定位模块,其用于利用快速径向对称变换改进方法对人眼输入图像中的像素进行处理,得到在固定半径范围内的瞳孔粗定位图像;
[0034]瞳孔精定位模块,其用于利用浅层卷积神经网络,对瞳孔粗定位模块得到的瞳孔粗定位图像进行精确定位,得到最终的瞳孔定位结果。
[0035]与现有技术相比,本专利技术的优势在于:本专利技术首先基于瞳孔定位的快速径向对称变换改进方法(FRSTFPL)对图像中的瞳孔进行大致定位,接着再接入浅层卷积神经网络(CNN)实现精准定位。结果表明,本专利技术提出的方法在尺寸为640
×
480像素的图像中的定位误差为8.51个像素,相比仅采用FRSTFPL和仅采用浅层CNN的方法,精度分为提升了11.31%和37.46%。本专利技术提出的方法不需要精准的半径信息和复杂的网络结构,就能在高效自动化、低计算复杂度的同时拥有较高的定位本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进FRST结合卷积神经网络的瞳孔定位方法,其特征在于,包括如下步骤:S1:利用快速径向对称变换改进方法对人眼输入图像中的像素进行处理,得到在固定半径范围内的瞳孔粗定位图像;S2:利用浅层卷积神经网络对步骤S1得到瞳孔粗定位图像进行精确定位,得到最终的瞳孔定位结果。2.根据权利要求1所述的一种基于改进FRST结合卷积神经网络的瞳孔定位方法,其特征在于,步骤S1所述的快速径向对称变换改进方法包括如下步骤:S1

1:对于人眼输入图像中的像素p,将沿其梯度g(p)方向半径距离为n的像素变换为正投影像素P
+ve
(p),变换过程为:其中,表示g(p)表示像素点p的梯度幅值,round(*)表示将所求值四舍五入为整数,||*||表示求范数;S1

2:根据步骤S1

1得到的正投影像素P
+vw
(p),生成梯度方向投影矩阵O
n
和梯度幅值投影矩阵M
n
;S1

3:根据步骤S1

2得到的梯度方向投影矩阵O
n
和梯度幅值投影矩阵M
n
,生成图像在单个输入半径n下的径向对称中心矩阵S
n
,计算过程如下:S
n
=F
n
*A
n
其中,F
n
(p)为输入半径n下的像素点p的径向对称特征,F
n
为输入半径n下全部像素点的径向对称特征,α为径向程度参数,A
n
为二维高斯核函数,max(*)为求最大值函数,M
n
(p)为梯度幅值投影矩阵中对应像素点p位置的值;S1

4:根据步骤S1

3得到的径向对称中心矩阵S
n
,对所有输入半径距离n下的径向对称中心矩阵S
n
累加并求均值,得到均值径向对称中心矩阵计算过程如下:其中,|N|为半径范围N中半径距离n的个数。S1

5:根据步骤S1

4得到的均值径向对称中心矩阵进行归一化处理,得到在固定半径范围内瞳孔的粗定位图像S。3.根据权利要求2所述的一种基于改进FRST结合卷积神经网络的瞳孔定位方法,其特征在于,步骤S1

5中对均值径向对称中心矩阵进行归一化处理过程如下:其中,为均值径向对称中心矩阵中对应像素点p位置的值,所有像素点对应的值构成最后的变换结果S,即粗定位图像;S(p)为归一化后的均值径向对称中心矩阵中对应像素点p位置的值,min(*)为求最小值函数,max(*)为求最大值函数。
4.根据权利要求2所述的一种基于改进FRST结合卷积神经网络的瞳孔定位方法,其特征在于,步骤S1

2中,所述梯度方向投影矩阵O
n
的生成方法为:初始化梯度方向投影矩阵O
n
为0矩阵,对于人眼输入图像的每个像素点的正投影像素,分别在O
n
中将该正投影像素位置对应的数值+1,直至遍历人眼输入图像中的所有像素点;所述梯度幅值投影矩阵M
n
的生成方法为:初始化梯度幅值投影矩阵M
n
为0矩阵,对于人眼输入图像的每个像素点的正投影像素,分别在M
n
中将该正投影像素位置对应的数值+||g(p)||,直至遍历人眼输入图像中的所有像素点。5.根据权利要求1所述的一种基于改进FRST结合卷积神经网络的瞳孔定位方法,其特征在于,步骤S2所述浅层卷积神经网络包含一个卷积核大小为5
×
5和卷积核个数为64的第一卷积层、一个卷积核大小为4
×
4和卷积核个数为128的第二卷积层、一个卷积核大小为4
...

【专利技术属性】
技术研发人员:姜伟昊佘清顺李烈锋黄俊杰王志辉孙清钱冠梁
申请(专利权)人:杭州东上智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1