一种基于眼动图推理的图像偏好预测方法技术

技术编号：35870323 阅读：32 留言：0更新日期：2022-12-07 11:04

本发明专利技术公开了一种基于眼动图推理的图像偏好预测方法。本方法主要包括眼动数据分析和图像语义特征分析两部分。眼动数据分析部分，首先采用图卷积网络对眼动轨迹、注视点和眼跳等多种眼动特征进行图嵌入表示。为了同时捕捉眼睛在观察刺激物时的时空相关性，采用图卷积网络学习眼动图的拓扑结构，捕获空间相关性；然后采用门控循环单元学习眼动图的时序变化，捕获时间相关性，再基于空间相关性和时间相关性输出眼动时空拓扑特征向量。图像语义特征分析部分，通过标准卷积网络块对图像进行语义特征学习，再通过全局平均池化得到图像的语义特征向量。最后将眼动时空拓扑特征向量和图像的语义特征向量融合后，经过全连接层和激活函数得到喜爱度分值的预测。得到喜爱度分值的预测。得到喜爱度分值的预测。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于眼动图推理的图像偏好预测方法

[0001]本专利技术涉及情感识别领域，尤其涉及一种基于眼动图推理的图像偏好预测方法。

技术介绍

[0002]如今，计算机视觉的相关研究已经从对视觉场景中的物体检测、物体识别发展到语义理解的阶段。但如何让机器自动地分析和判断人与视觉场景刺激的情绪与情感交互关系依然是一个非常有挑战性的任务。常见的情感计算模型为多模态联合预测方式，但当前的研究方向集中在文本，语音和图像三大模态，另外也有少量研究者辅以生理信号比如脑电，近红外脑功能成像等，但数据获取较难，手段较为复杂。认知心理学表明，人的眼动信息与心理活动息息相关。人的眼动生理行为不仅反应人类获取视觉信息的探索过程，各类眼动指标也反应观察者的心理变化过程，比如瞳孔的大小反映人对当前刺激的情感激发程度，兴趣区平均驻留时间反映受众对当前刺激区域的关注程度，眼动轨迹揭示被试的完整的认知加工过程，体现认知负荷和兴趣特征，等等。另外，当前光学传感器飞速发展，日常可用的多目移动高精摄像设备更加普及，为快速低成本地获取人眼信息提供极大便利，为研究眼动行为与心理认知提供了日益完备的硬件技术支持。
[0003]鉴于文本、语音和图像或视频属于排列整齐的欧几里何数据，处理这类欧式数据的技术已经很成熟，而由注视点和眼跳组成的眼动轨迹属于非欧式数据(non
‑
Eucliden domain data)，无法采用常规手段加以处理和建模。

技术实现思路

[0004]针对以上问题，本专利技术提出一种基于眼动图推理的图像偏好预...

【技术保护点】

【技术特征摘要】
1.一种基于眼动图推理的图像偏好预测方法，其特征在于，包括如下步骤：S1：通过采集设备获取待测对象观察预设的原图时的眼动数据，再对所述眼动数据进行图嵌入表示，得到眼动图的拓扑结构和时序变化信息；S2：采用图卷积网络学习所述眼动图的拓扑结构，并基于所述眼动图的拓扑结构对偏好与眼动图的空间依赖关系进行建模，得到偏好与眼动图的空间相关性；然后采用门控循环单元学习所述眼动图的时序变化信息，并基于所述眼动图的时序变化信息对偏好与眼动图的时间依赖关系进行建模，得到偏好与眼动图的时间相关性；最后基于所述偏好与眼动图的空间相关性和时间相关性，输出眼动时空拓扑特征向量；S3：采用标准卷积网络块对所述预设的原图进行语义特征学习，并通过全局平均池化操作得到所述预设的原图的语义特征向量；S4：将所述眼动时空拓扑特征向量和所述预设的原图的语义特征向量在高维空间进行特征融合，再经过全连阶层和激活函数，即得到待测对象对预设的原图的喜爱度分值。2.根据权利要求1所述的一种基于眼动图推理的图像偏好预测方法，其特征在于，所述步骤S1中的采集设备选用：高精摄像头或者眼动追踪设备。3.根据权利要求2所述的一种基于眼动图推理的图像偏好预...

【专利技术属性】
技术研发人员：张永福，袁广振，张会柱，赵金升，梁松，
申请(专利权)人：徐州华讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人