【技术实现步骤摘要】
自适应的视线估计方法和设备
本公开总体说来涉及视线估计领域,更具体地讲,涉及一种自适应的视线估计方法和设备。
技术介绍
相关技术中的估计方法通常使用一个基本模型,通过该基本模型可以估计任何人的视线。但是,通常通过拟合大量的作为训练数据的人眼图像,得到通用参数,以建立该基本模型,由于每个用户的眼部形状不同,因此,对于眼部形状与通用参数所对应的眼部形状相似的人,该基本模型的预测效果较好(例如,预测结果的准确度高),相反的,对于眼部形状与通用参数所对应的眼部形状之间存在较大差异的人,该基本模型的预测效果较差。
技术实现思路
本公开的示例性实施例在于提供一种自适应的视线估计方法和设备,以解决现有技术存在的针对特定人的视线估计结果的准确度低的问题。根据本公开的示例性实施例,提供了一种自适应的视线估计方法。所述视线估计方法包括:获取用于标定的数据的特征和用于估计的数据的特征;通过获取的特征来进行视线估计。可选的,所述视线估计方法还包括:获取神经网络模型,其中,所述获取特征的步骤包括:通过所述神 ...
【技术保护点】
1.一种自适应的视线估计方法,其中,所述视线估计方法包括:/n获取用于标定的数据的特征和用于估计的数据的特征;/n通过获取的特征来进行视线估计。/n
【技术特征摘要】
1.一种自适应的视线估计方法,其中,所述视线估计方法包括:
获取用于标定的数据的特征和用于估计的数据的特征;
通过获取的特征来进行视线估计。
2.根据权利要求1所述的视线估计方法,其中,所述视线估计方法还包括:获取神经网络模型,
其中,所述获取特征的步骤包括:通过所述神经网络模型来提取用于标定的数据的特征和/或通过所述神经网络模型来提取用于估计的数据的特征。
3.根据权利要求2所述的视线估计方法,其中,获取神经网络模型的步骤包括:通过用于训练的数据,训练所述神经网络模型。
4.根据权利要求3所述的视线估计方法,其中,用于训练的数据包括第一用户图像和第二用户图像,
其中,第一用户图像和第二用户图像分别为同一用户在注视第一对象时的图像和在注视第二对象时的图像;
其中,训练所述神经网络模型的步骤包括:
通过将第一用户图像和第二用户图像作为输入,并且将第一对象和第二对象的相对位置作为输出,来训练所述神经网络模型。
5.根据权利要求3所述的视线估计方法,其中,用于训练的数据包括用于训练的图像相关数据和用于训练的视线标签,训练所述神经网络模型的步骤包括:
将用于训练的视线标签转化为二分类标签;
确定与所述二分类标签对应的损失函数;
通过用于训练的图像相关数据、所述二分类标签和所述损失函数来训练第一神经网络模型;
其中,将用于训练的视线标签转化为二分类标签的步骤包括:
确定用于训练的视线标签在特定坐标轴上的坐标Ya,其中,Yamin≤Ya≤Yamax,Yamin和Yamax分别为坐标Ya的最小值和最大值;
在所述特定坐标轴上以预定间距设置多个结点,其中,所述预定间距的大小是bin_size,
产生包括维度为所述多个结点的数量的向量的二分类标签,
其中,所述向量的各个维度的值通过所述预定间距的大小和所述坐标Ya来确定,
其中,所述损失函数通过所述向量的各个维度的值,以及激活概率来计算,所述激活概率通过与各个结点对应的用于训练的数据来计算。
6.根据权利要求3至5中的任一项权利要求所述的视线估计方法,其中,用于训练的数据包括用于训练的图像相关数据和用于训练的视线标签,训练所述神经网络模型的步骤包括:
从用于训练的图像相关数据和用于训练的视线标签提取两对样本,其中,所述两对样本对应于同一用户,每对样本包括一个用于训练的图像相关数据和一个对应的用于训练的视线标签,所述两对样本的两个视线标签之间的差异大于第一阈值且小于第二阈值;
通过所述两对样本来训练第二神经网络模型。
7.根据权利要求6所述的视线估计方法,其中,训练所述神经网络模型的步骤还包括:
通过所述提取两对样本的步骤来提取另外两对样本,其中,所述另外两对样本的两个视线标签之间的差异大于第三阈值且小于第四阈值,其中,第三阈值大于或等于第一阈值,第四阈值小于或等于第二阈值;
通过所述另外两对样本来继续训练所述第二神经网络模型,
其中,所述提取两对样本的步骤被至少执行两次,以使每次提取的两对样本的两个视线标签之间的差异小于前一次提取的两对样本的两个视线标签之间的差异。
8.根据权利要求6或7所述的视线估计方法,其中,在训练所述第二神经网络模型之前,还包括:
基于第一神经网络模型来设置第二神经网络模型的参数,
其中,第二神经网络模型和第一神经网络模型具有相同的用于特征提取的网络层,通过所述两对样本来训练所述第二神经网络模型的步骤包括:通过所述两对样本的两个用于训练的图像相关数据和与所述两个用于训练的图像相关数据对应的二分类标签来训练所述第二神经网络模型的分类器。
9.根据权利要求8所述的视线估计方法,其中,训练所述第二神经网络模型的分类器的步骤包括:
通过训练的第一神经网络模型分别提取所述两个用于训练的图像相关数据的特征;
计算所述两个用于训练的图像相关数据的特征...
【专利技术属性】
技术研发人员:郭天楚,张辉,刘夏冰,韩在濬,崔昌圭,
申请(专利权)人:北京三星通信技术研究有限公司,三星电子株式会社,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。