一种基于注意力追踪的物体描述方法技术

技术编号：35974584 阅读：58 留言：0更新日期：2022-12-17 22:42

本发明专利技术涉及一种基于注意力追踪的物体描述方法，其中包括基于视觉SLAM和视线追踪的注意力预测机制，和以注意力概率图为导向的物体描述。前者通过几何方法在三维地图中预测目标的关注区域，并映射到图像平面上得到一张热力图。后者使用该热力图赋予物体权值，并规定优先描述人眼注意力的区域。我们的物体描述算法在Visual Genome公开数据集上利用局部描述算法进行预训练，在清洗过的VG数据集上训练作为最终训练结果。我们模拟特殊群体(如孤独症儿童、脑退化症长者等)康复训练的场景制作数据集，并通过实验证明，该系统能实时自主定位用户的注意力区域，并准确描述区域内的物体。并准确描述区域内的物体。并准确描述区域内的物体。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力追踪的物体描述方法

[0001]本专利技术涉及物体描述
，特别涉及一种基于注意力追踪的物体描述方法。

技术介绍

[0002]目前学术界和产业界在注意力追踪和物体描述都有较为成熟的研究，但两者的结合应用似乎还得不到重视，算法预测图像平面内人可能关注的区域，并通过图像描述有针对性地将这些物体表述出来，让语句更加接近于人的描述。目前大部分学者都关注在第一人称视角的图像描述上，很少有基于特定对象关注区域的图像描述的研究。一部分学者提出新的网络结构实现更高精度的追踪，但是方法的目标和注视物体必须同时出现在图片上，而很多情况因受限于相机的视野而无法达到该要求，这极大限制了算法的应用。一部分人为了摆脱相机视野的影响，他们提出了一个利用卷积式编解码结构来学习头部姿势和物体位置之间的空间关系的框架，但是该方法只能用特定范围内俯视图表示注视物体的位置，这会受到场景大小的限制。

技术实现思路

[0003]本专利技术提供一种基于注意力追踪的物体描述方法，借助了视线追踪获得的概率图描述特定对象的关注区域，实现第三人称视角的物体描述。采用几何方法估计注视物体，得益于空间关系的构建，实现了跨帧的注视估计，并克服复杂背景的干扰。
[0004]为了实现上述目的，本专利技术提供以下技术方案：
[0005]一种基于注意力追踪的物体描述方法，具体步骤如下：
[0006]S1、根据已知的视线追踪的结果，加入头部位姿估计，根据数据的置信度加权调整以得到稳定和精确的结果；
[0007]S2、找出...

【技术保护点】

【技术特征摘要】
1.一种基于注意力追踪的物体描述方法，其特征在于，具体步骤如下：S1、根据已知的视线追踪的结果，加入头部位姿估计，根据数据的置信度加权调整以得到稳定和精确的结果；S2、找出地图内的可视点云S，并剔除掉所有被遮挡点云R，得到有效点云E；S3、以点到视线距离为指引，通过构建高斯模型给有效点云E分配权值，并映射到图像平面上得到一张热力图；S4、结合所得的热力图结果，在物体描述算法的模型测试阶段将注意力权值分配到图像上，并在网络选取候选框时作为得分标准，最后输出注意力权值较大区域的物体描述；S5、采集若干段视频序列，作为物体描述的输入，通过实际的训练得到注意力预测的真实值。2.根据权利要求1所述的基于注意力追踪的物体描述方法，其特征在于，步骤S1的具体过程为：已知目标的左右眼位置、视线方向、头部朝向、以及归一化置信度，计算人的最终视线起点和视线方向在...

【专利技术属性】
技术研发人员：蒋子健，陈功，蒙顺政，
申请(专利权)人：深圳无芯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人