一种支持可变时长的视觉注意力动态预测方法和系统技术方案

技术编号：35748039 阅读：22 留言：0更新日期：2022-11-26 18:53

本发明专利技术公开了一种支持可变时长的视觉注意力动态预测方法和系统，包括：(1)采集多年龄段用户注视静态图像的注视点状态图序列；(2)对静态图像进行特征拆分和合并得到低分辨率图，进而得到其对应的高分辨率图；(3)基于注视点状态图确定注视点遮罩，将注视点状态图的注视点遮罩位置替换为高分辨图，其余位置替换为低分辨率图，以得到注视点增强的动态视觉注视点序列；(4)采用动态视觉注视点序列和静态图像对包含生成器和鉴别器的GAIL模型进行训练以优化模型参数；(5)利用生成器预测输出待测静态图像的视觉注视点图像序列；(6)将视觉注视点图像序列融合成标注有视觉注意力的视频，该方法有效地表示人类连续动态发生的眼动。该方法有效地表示人类连续动态发生的眼动。该方法有效地表示人类连续动态发生的眼动。

全部详细技术资料下载

【技术实现步骤摘要】
一种支持可变时长的视觉注意力动态预测方法和系统

[0001]本专利技术涉及计算机视觉
，具体涉及一种支持可变时长的视觉注意力动态预测方法和系统。

技术介绍

[0002]在视觉注意力预测结果的可视化方面，现有关于静态图像的视觉注意力预测结果表示均为静态，例如CN101493890B的中国专利技术专利提出了基于特征的动态视觉注意区域提取方法，该方法将一段时长的视觉注意分布利用有效编码原理，为图片上每个特征衡量增量编码长度指标，连续的采样，从而不同帧的数据可以一起指导显著度的处理。但是最终显示结果仍以静态预测图表现，没有考虑真实人眼的视觉注意是连续动态随时间变化且前后连贯，没有做出可变时长的动态预测。
[0003]在视觉注意力评估人群方面，现有的视觉注意力预测技术所用数据集多为单一人群，未细分用户且预测结果唯一。例如CN114170537A的中国专利技术专利通过构建多模态模型得出固定视觉兴趣区域，单一结果视觉注意力预测结果并没有考虑人的个体差异，热点图区域代表一个用户结果，未在研究人群方面做出一定细分，也没有展现不同用户之间的差异，无法模拟个体差异。例如CN114092900A的中国专利技术专利公开了一种驾驶员视觉注意力预测方法，针对驾驶场景中驾驶员这一单一群体用户进行视觉注意力预测，再如CN111951637A的中国专利技术专利公开了一种任务情景相关联的无人机飞行员视觉注意力分配模式提取方法，针对无人机飞行员进行视觉注意力预测，涵盖人群单一，同一用户群体的个体未做区分，预测结果固定唯一。
专利技术内...

【技术保护点】

【技术特征摘要】
1.一种支持可变时长的视觉注意力动态预测方法，其特征在于，包括以下步骤：步骤1，采集多年龄段用户注视静态图像的注视点状态图序列；步骤2，对静态图像进行特征拆分和合并得到低分辨率图，基于低分辨率图得到对应的高分辨率图；步骤3，基于注视点状态图确定注视点遮罩，将注视点状态图的注视点遮罩位置替换为高分辨图，其余位置替换为低分辨率图，以得到注视点增强的动态视觉注视点序列；步骤4，采用动态视觉注视点序列和静态图像对包含生成器和鉴别器的GAIL模型进行训练以优化模型参数；步骤5，将待预测的静态图像输入至参数优化的生成器中，利用生成器预测输出表示视觉注意力的视觉注视点图像序列；步骤6，根据用户指定的可变时长，将视觉注视点图像序列融合成标注有视觉注意力的视频。2.根据权利要求1所述的支持可变时长的视觉注意力动态预测方法，其特征在于，步骤1中，首先根据年龄阶段对用户群体进行细分，并将采用眼动仪记录用户在不同任务驱动下的动态眼动数据，即得到的注视点状态图序列。3.根据权利要求2所述的支持可变时长的视觉注意力动态预测方法，其特征在于，在采集注视点状态图序列时，图像与图像之间留有至少5s的空白时间，以避免对原先注意过的物体或者位置存在反应上的延迟。4.根据权利要求1所述的支持可变时长的视觉注意力动态预测方法，其特征在于，步骤2中，将静态图像在颜色、强度和方向三个维度特征上分解后，将三个维度特征进行叠加得到低分辨率图。5.根据权利要求1所述的支持可变时长的视觉注意力动态预测方法，其特征在于，步骤2中，采用超分辨率重建算法SRCNN将低分辨率图转换为对应的高分辨率图。6.根据权利要求1所述的支持可变时长的视觉注意力动态预测方法，其特征在于，步骤3中，所述基于注视点状态图确定注视点遮罩，包括：将注视点状态图在空间离散为网格，将注视点所在网格作为注视点遮罩；步骤3中，采用以下公式得到注视点增强的动态视觉注视点序列：B
t+1
＝M
t
⊙
H+(1
‑
M
t
)
⊙
B
t
...

【专利技术属性】
技术研发人员：厉向东，阴凯琳，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人