一种基于长短时记忆网络扫视路径学习的人群识别方法技术

技术编号：22239025 阅读：24 留言：0更新日期：2019-10-09 18:48

本发明专利技术涉及一种基于长短时记忆网络扫视路径学习的人群识别方法，采集不同人群组别的眼动数据构建训练样本集，利用LSTM网络来有监督地学习出不同类别扫视模式与人群组别标记之间的映射关系，根据训练后的网络来对待评估观察者的扫视序列进行得分判定，实现基于扫视路径学习的人群识别，与其他手段结合帮助提高人群识别的准确性，促进相关应用的发展。

A Crowd Recognition Method Based on Long-term and Short-term Memory Network Scanning Path Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于长短时记忆网络扫视路径学习的人群识别方法
本专利技术属于图像处理领域，涉及一种人群识别方法，即通过对不同人群的扫视路径进行有监督学习，来建立扫视模式与人群组别之间的映射关系，实现基于扫视路径学习的人群识别。
技术介绍
每秒钟大约有108阶比特数据流进入人眼，远超过大脑能够全部处理和吸收的信息量。面对如此大量与复杂的视觉输入，人类视觉系统仍然能够有效地获取场景重要内容，来增加对外部世界的了解。这主要是因为选择性视觉注意机制的存在。视觉注意是人类视觉感知的一项重要特征，是大部分视觉任务的关键因素，其本质在于快速提取场景重要区域，并对其分配主要计算资源。对人类的视觉注意过程进行研究不仅有助于探索人类视觉加工的内在机理，也能够为大数据时代下资源的合理分配与信息的高效处理提供解决方案，来帮助解决医疗诊断、社会安全等多个领域中的应用问题。在目前关于视觉注意的研究中，研究者们主要关注于人们在观察视觉输入时表现出的共性眼动特征。LaurentItti等人在文章“AModelofSaliency-BasedVisualAttentionforRapidSceneAnalysis”,IEEETransactionsonPatternAnalysisandMachineIntelligence,vol.20,no.11,pp.1254-1259,1998中通过提出模拟视网膜神经元细胞感受野的中心-周围对比度机制来估计场景不同区域被人们关注的概率。基于深度学习强大的表示与学习能力，近期视觉注意的研究则倾向于探索由原始图像到被关注概率图的直接映射关系。WenguanWang...

【技术保护点】
1.一种基于长短时记忆网络扫视路径学习的人群识别方法，其特征在于步骤如下：步骤1：构建测试图像库首先根据具体人群识别问题来选择图像构建测试图像库；步骤2：采集不同人群组别扫视序列组织眼动实验分别采集不同组别观察者在测试图像库上的眼动数据，获取其中扫视路径序列；步骤3：提取扫视序列特征提取观察者在测试图像上扫视序列对应的特征，为下一步训练LSTM网络做准备；3a)图像过分割采用简单线性迭代聚类算法SLIC将图像分成多个过分割区域，其中每个过分割区域由相邻且具有相似特性的像素点组成；3b)提取扫视序列特征利用语义哈希算法来对采集的扫视路径进行特征提取：对于当前扫视路径上的每一个注视点，找到其所在图像过分割区域，提取该过分割区域中心大小为d×d×3的原始图像块，将其对应的向量输入到语义哈希编码特征提取网络中，提取中心层Nc维二值特征；即对于长度为m的扫视路径序列，得到其所对应的Nc×m扫视路径特征；步骤4：训练LSTM网络首先构建训练LSTM网络需要用到的训练样本集：训练样本集由扫视路径特征与对应的人群组别标记组成，LSTM网络的学习目标是建立由扫视路径特征到人群组别标记之间的映射关系；其次...

【技术特征摘要】
1.一种基于长短时记忆网络扫视路径学习的人群识别方法，其特征在于步骤如下：步骤1：构建测试图像库首先根据具体人群识别问题来选择图像构建测试图像库；步骤2：采集不同人群组别扫视序列组织眼动实验分别采集不同组别观察者在测试图像库上的眼动数据，获取其中扫视路径序列；步骤3：提取扫视序列特征提取观察者在测试图像上扫视序列对应的特征，为下一步训练LSTM网络做准备；3a)图像过分割采用简单线性迭代聚类算法SLIC将图像分成多个过分割区域，其中每个过分割区域由相邻且具有相似特性的像素点组成；3b)提取扫视序列特征利用语义哈希算法来对采集的扫视路径进行特征提取：对于当前扫视路径上的每一个注视点，找到其所在图像过分割区域，提取该过分割区域中心大小为d×d×3的原始图像块，将其对应的向量输入到语义哈希编码特征提取网络中，提取中心层Nc维二值特征；即对于长度为m的扫视路径序列，得到其所对应的Nc×m扫视路径特征；步骤4：训练LSTM网络首先构建训练LSTM网络需要用到的训练样本集：训练样本集由扫视路径特征与对应的人群组别标记组成，LSTM网络的学习目标是建立由扫视路径特征到人群组别标记之间的映射关系；其次是利用训练样本集训练LSTM网络：依次将一个扫视路径上连续注视点对应的语义哈希编码特征作为网络输入，迭代得到最顶层回归层的人群组别预测得分，再使用基于时间的反向传播算法根据预测得分与对应标记的预测误差迭代...

【专利技术属性】
技术研发人员：夏辰，韩军伟，郭雷，李宽，李红霞，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人