【技术实现步骤摘要】
本专利技术涉及计算机视觉,具体为一种结合多注意力机制的视线估计方法。
技术介绍
1、人类注视方向是分析人类行为的重要指标,其反映了对环境中各种视觉刺激的注意水平和认知状态。为了更好地理解人类注视机理,学者需要更好地度量人类视线角度来分析视线中所蕴含人类意识方面的信息,而视线估计方法是指通过相机对人脸或人眼进行采集,使用图像处理手段,获取眼部坐标,并通过计算确定人眼注视点位置或视线矢量方向,该技术在人机交互、虚拟现实、医学和疲劳驾驶检测等诸多领域都有着十分广泛的应用。
2、早期的视线估计方法主要采用基于角膜反射的方法和基于眼球模型的方法。这类方法依赖于昂贵的专用设备和精确的数据校准(如光轴、角膜半径和瞳孔半径),且通常受限于周边环境的影响,很难得到高分辨率的图片,其效果在实际场景中往往不太理想。基于外观的视线估计的目标主要是学习一个图像i到视线向量的映射其中θ、φ为偏航角、俯仰角以及滚动角,而g分别表示在眼坐标系统[gx,gx,gz]中的真实值的分量。早期的基于外观的方法一般针对实验者个人学习映射函数,直接将人眼或人脸图像输入
...【技术保护点】
1.一种结合多注意力机制的视线估计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种结合多注意力机制的视线估计方法,其特征在于:所述GAZE360在公共数据集上训练视线估计模型对人脸及图片进行训练及测试,采用pinballloss获得某一分位数下的预测输出,利用输出完成预测输出范围的回归模型;
3.根据权利要求2所述的一种结合多注意力机制的视线估计方法,其特征在于:所述θgt为视线真实值,θ为测量值,σ为5%和95%分位点之间的方差,τ为任意分位数,τ设置为5%。
4.根据权利要求3所述的一种结合多注意力机制的视线估计方
...【技术特征摘要】
1.一种结合多注意力机制的视线估计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种结合多注意力机制的视线估计方法,其特征在于:所述gaze360在公共数据集上训练视线估计模型对人脸及图片进行训练及测试,采用pinballloss获得某一分位数下的预测输出,利用输出完成预测输出范围的回归模型;
3.根据权利要求2所述的一种结合多注意力机制的视线估计方法,其特征在于:所述θgt为视线真实值,θ为测量值,σ为5%和95%分位点之间的方差,τ为任意分位数,τ设置为5%。
4.根据权利要求3所述的一种结合多注意力机制的视线估计方法,其特征在于:所述视线估计模型的网络初始输入形状为32×21×224×224的7帧3通道图像,经过一个多头注意力机制的输入模块得到形状为32×16×56×56的多头注意力图。
5.根据权利要求4所述的一种结合多注意力机制的视线估计方法,其特征在于:所述多头自注意力机制用于增强输入图像中视线的显著性特征,多头自注意力机制由下式所定义;<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。