一种眼睛属性分类方法、装置及存储介质制造方法及图纸

技术编号:31814032 阅读:16 留言:0更新日期:2022-01-08 11:17
本发明专利技术公开了一种眼睛属性分类方法、装置及存储介质,包括:获取眼部图像;获取对眼部图像进行标注得到的四类标注数据,并将预设比例的四类标注作为训练数据集,四类标注数据包括:无眼睛图像、闭眼图像、瞳孔可见图像和瞳孔不可见图像;将训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型;将待分类眼部图像输入至眼睛属性分类模型中,输出眼睛属性分类模型中三个级联分类器的分类结果。本发明专利技术实施例不仅能够保证眼睛属性判断的准确性,还能够有效适用于复杂场景。景。景。

【技术实现步骤摘要】
一种眼睛属性分类方法、装置及存储介质


[0001]本专利技术涉及图像处理
,尤其是涉及一种眼睛属性分类方法、装置及存储介质。

技术介绍

[0002]眼睛属性分类在智能座舱中对驾驶员的状态分析起着重要的作用,可以用于疲劳驾驶判断,包括眼睛睁闭识别,辅助表情识别和视线估计。目前,现有眼睛属性分类方法通常为基于几何先验和特征定位的方式来进行眼睛属性分类,但是现有的眼睛属性分类方法难以适用于真实环境中的复杂情况,眼睛属性分类的结果较差。

技术实现思路

[0003]本专利技术提供了一种眼睛属性分类方法、装置及存储介质,以解决现有的眼睛属性分类方法无法是适用于真实环境中复杂的情况,导致眼睛属性分类的结果较差的技术问题。
[0004]本专利技术的一个实施例提供了一种眼睛属性分类方法,包括:获取眼部图像;获取对所述眼部图像进行标注得到的四类标注数据,并将预设比例的四类标注作为训练数据集,所述四类标注数据包括:无眼睛图像、闭眼图像、瞳孔可见图像和瞳孔不可见图像;将所述训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型;将待分类眼部图像输入至所述眼睛属性分类模型中,输出所述眼睛属性分类模型中三个级联分类器的分类结果,所述三个级联分类器包括第一分类器、第二分类器和第三分类器,第一分类器用于判断所述待分类眼部图像中是否存在眼睛,所述第二分类器用于判断所述待分类图像中眼睛是否睁开,所述第三分类器用于判断瞳孔是否可见。
[0005]进一步的,所述获取眼部图像,包括:采集目标图像,利用人脸检测算法检测目标图像中是否存在人脸,若存在人脸则截取所述目标图像中的头部图像,采用关键点检测算法得到所述头部图像的关键信息,并从所述关键点信息位置截取得到所述目标图像中的眼部图像。
[0006]进一步的,获取对所述眼部图像进行标注得到的四类标注数据,包括:判断所述眼部图像中是否存在眼睛图像,若不存在眼睛图像,则标注为无眼睛图像;若存在眼睛图像,判断所述眼睛图像的上下眼睑是否闭合,若是则标注为闭眼图像;若所述眼睛图像的上下眼睑不闭合,则判断所述眼睛图像中的瞳孔是否可见,在所述瞳孔可见时标注为瞳孔可见图像,在所述瞳孔为不可见时标注为瞳孔不可见图像。
[0007]进一步的,将所述训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型,包括:将训练数据集进行数据增强处理后得到预处理数据,将所述预处理数据输入至预先设计好的神经网络结构中,采用交叉熵作为损失函数进行模型分类训练,得到眼睛属性分类模型。
[0008]进一步的,所述数据增强处理包括但不限于水平翻转、随机旋转、对比度拉伸、随机高斯噪声、图像亮度变换、图像gamma值调整的至少一种。
[0009]进一步的,所述损失函数的表达式为:y
i
表示样本i的标签,正样本为1,负样本为0,p
i
为模型预测样本i为正样本的概率。
[0010]进一步的,将待分类眼部图像输入至所述眼睛属性分类模型中,输出所述眼睛属性分类模型中三个级联分类器的分类结果,包括:将待分类眼部图像输入至所述眼睛属性分类模型中,在第一分类器判断所述待分类眼部图像中不存在眼睛图像时,得到分类结果为所述待分类眼部图像中无眼睛图像;在第一分类器判断所述待分配眼部图像中存在眼睛图像时,通过第二分类器判断所述眼睛图像是否睁开,若判断为闭眼状态,则直接输出闭眼图像的分类结果,若判断为睁眼状态,则通过第三分类器判断瞳孔是否可见,若判断瞳孔可见则输出瞳孔可见的分类结果,若瞳孔不可见则输出瞳孔不可见的分类结果。
[0011]本专利技术的一个实施例提供了一种眼睛属性分类装置,包括:眼部图像获取模块,用于获取眼部图像;数据标注模块,用于获取对所述眼部图像进行标注得到的四类标注数据,并将预设比例的四类标注作为训练数据集,所述四类标注数据包括:无眼睛图像、闭眼图像、瞳孔可见图像和瞳孔不可见图像;模型分类训练模块,用于将所述训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型;眼睛属性分类模块,用于将待分类眼部图像输入至所述眼睛属性分类模型中,输出所述眼睛属性分类模型中三个级联分类器的分类结果,所述三个级联分类器包括第一分类器、第二分类器和第三分类器,第一分类器用于判断所述待分类眼部图像中是否存在眼睛,所述第二分类器用于判断所述待分类图像中眼睛是否睁开,所述第三分类器用于判断瞳孔是否可见。
[0012]本专利技术的一个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的眼睛属性分类方法的步骤。
[0013]本专利技术实施例首先通过第一分类器对眼部图像是否存在眼睛进行判别,在判别到眼部图像中存在眼睛之后,再进行后续的眼睛属性判别,能够在实际应用场景中进行眼睛属性的合理区分,从而提高眼睛属性分类的正确性;本专利技术实施例根据眼睛的上下眼睑闭合程度判断眼睛的睁闭状态,不同于基于眼睛几何先验和特征定位的方式判断眼睛睁闭状态难以适应于复杂场景,本专利技术实施例能够在复杂下保证分类的准确性;本专利技术实施例进
一步根据瞳孔的形状轮廓判别瞳孔是否可见,通过三个级联分类器对眼睛的多种属性进行级联判别,不仅能够保证眼睛属性判断的准确性,还能够有效适用于复杂场景。
附图说明
[0014]图1是本专利技术实施例提供的眼睛属性分类方法的流程示意图;图2是本专利技术实施例提供的数据标注的流程示意图;图3 是本专利技术实施例提供的无眼睛图像示意图;图4是本专利技术实施例提供的闭眼图像示意图;图5 是本专利技术实施例提供的瞳孔不可见图像示意图;图6 是本专利技术实施例提供的瞳孔可见图像示意图;图7是本专利技术实施例提供的一种神经网络结构;图8是本专利技术实施例提供的一种眼睛属性分类流程示意图;图9是本专利技术实施例提供的眼睛属性分装置的结构示意图。
具体实施方式
[0015]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0016]在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0017]在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
[0018本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种眼睛属性分类方法,其特征在于,包括:获取眼部图像;获取对所述眼部图像进行标注得到的四类标注数据,并将预设比例的四类标注作为训练数据集,所述四类标注数据包括:无眼睛图像、闭眼图像、瞳孔可见图像和瞳孔不可见图像;将所述训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型;将待分类眼部图像输入至所述眼睛属性分类模型中,输出所述眼睛属性分类模型中三个级联分类器的分类结果,所述三个级联分类器包括第一分类器、第二分类器和第三分类器,第一分类器用于判断所述待分类眼部图像中是否存在眼睛,所述第二分类器用于判断所述待分类眼部图像中眼睛是否睁开,所述第三分类器用于判断瞳孔是否可见。2.如权利要求1所述的眼睛属性分类方法,其特征在于,所述获取眼部图像,包括:采集目标图像,利用人脸检测算法检测目标图像中是否存在人脸,若存在人脸则截取所述目标图像中的头部图像,采用关键点检测算法得到所述头部图像的关键信息,并从所述关键点信息位置截取得到所述目标图像中的眼部图像。3.如权利要求1所述的眼睛属性分类方法,其特征在于,获取对所述眼部图像进行标注得到的四类标注数据,包括:判断所述眼部图像中是否存在眼睛图像,若不存在眼睛图像,则标注为无眼睛图像;若存在眼睛图像,判断所述眼睛图像的上下眼睑是否闭合,若是则标注为闭眼图像;若所述眼睛图像的上下眼睑不闭合,则判断所述眼睛图像中的瞳孔是否可见,在所述瞳孔可见时标注为瞳孔可见图像,在所述瞳孔为不可见时标注为瞳孔不可见图像。4.如权利要求1所述的眼睛属性分类方法,其特征在于,将所述训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型,包括:将训练数据集进行数据增强处理后得到预处理数据,将所述预处理数据输入至预先设计好的神经网络结构中,采用交叉熵作为损失函数进行模型分类训练,得到眼睛属性分类模型。5.如权利要求4所述的眼睛属性分类方法,其特征在于,所述数据增强处理包括但不限于水平翻转、随机旋转、对比度拉伸、随机高斯噪声、图像...

【专利技术属性】
技术研发人员:何卓楠刘国清王启程杨广徐子健
申请(专利权)人:深圳佑驾创新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1