受丘脑注意机制调控的信息融合的视觉跟踪方法及系统技术方案

技术编号：21434747 阅读：26 留言：0更新日期：2019-06-22 12:42

本发明专利技术提供一种受丘脑注意机制调控的多层视皮层信息融合的视觉跟踪方法及系统，所述视觉跟踪方法包括：从视频中的第一帧中获取待跟踪目标以及位置标签；基于预训练卷积神经网络模型，获取第一帧中待跟踪目标的不同卷积层的特征；根据位置标签，构建高斯标签；通过相关滤波得到各卷积层的模板；针对新的一帧，在前一帧的中心中裁剪出待搜索区域，利用相关滤波，以及各卷积层的模板，得到各卷积层的响应；利用空间注意机制以及时间注意机制动态调整其他层的响应的权重；根据调整后的其他层的权重，确定待跟踪目标的所在位置。本发明专利技术对于不同视皮层分配不同的权重，将不同层视觉特征去动态组合到一起，实现视觉跟踪性能的有效提升。

全部详细技术资料下载

【技术实现步骤摘要】
受丘脑注意机制调控的信息融合的视觉跟踪方法及系统本申请要求于2018年11月12日提交中国专利局、申请号为201811341205.0、专利技术名称为“一种受丘脑注意机制调控的多层视皮层信息融合的视觉跟踪模型”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。
本专利技术涉及类脑智能和人工智能领域，具体涉及一种受丘脑注意机制调控的信息融合的视觉跟踪方法及系统。
技术介绍
在灵长类动物中，除了嗅觉外，丘脑接收其他各种感觉输入。除了对信息进行转换，丘脑还在皮层的信息传递过程中起到调控作用。丘脑主要由外膝体(LGN)、丘脑网状核(TRN)以及丘脑枕(Pulvinar)组成。外膝体将感觉器官与大脑皮层连接起来，对信息进行中转；丘脑网状核调控大脑皮层与丘脑之间的信息传递；丘脑枕是丘脑中最大的核团，神经科学的实验研究表示丘脑枕与众多视觉皮层具有大量双向连接。如图所示，丘脑与众多皮层区域有着密切连接。比如说初级视觉皮层1(V1)，初级视觉皮层2(V2)，初级视觉皮层4(V4)，下颞叶皮层(IT)，背外侧前额叶皮层(PLPFC)，眶额叶皮层(OFC)，后顶叶皮质(PPC)这些连接都是双向的，易于形成反馈的环路，因此丘脑是一个重要的脑区起到了中央调控的作用。而视觉注意作为人类的一项重要能力，它使得我们能够有效处理对于我们最重要的事情。视觉注意一直以来是神经科学、心理学、计算机科学等领域的研究热点问题。目前的研究成果，尤其是计算机领域的建模，更多的是关注每层皮层内部在视觉注意中的作用，而对于跨层皮层之间的空间注意机制，以及视频流中的时间注意机制研究很少。目前视觉跟踪算...

【技术保护点】
1.一种受丘脑注意机制调控的多层视皮层信息融合的视觉跟踪方法，其特征在于，所述视觉跟踪方法包括：步骤S100，从视频中的第一帧中获取待跟踪目标以及在所述待跟踪目标的位置标签；步骤S200，基于预训练卷积神经网络模型，获取第一帧中待跟踪目标的不同卷积层的特征；步骤S300，根据所述待跟踪目标的位置标签，构建高斯标签；步骤S400，根据所述高斯标签及步骤S200中得到的不同卷积层的特征，通过相关滤波得到各卷积层的模板；步骤S500，针对新的一帧，在前一帧的中心中裁剪出待搜索区域，基于预训练卷积神经网络模型，利用相关滤波，以及得到的各卷积层的模板，得到各卷积层的响应；步骤S600，将最后一层的卷积层的响应当作一个基础响应，利用空间注意机制以及时间注意机制动态调整其他层的响应的权重；步骤S700，根据调整后的其他层的权重，确定待跟踪目标的所在位置。

【技术特征摘要】
2018.11.12 CN 20181134120501.一种受丘脑注意机制调控的多层视皮层信息融合的视觉跟踪方法，其特征在于，所述视觉跟踪方法包括：步骤S100，从视频中的第一帧中获取待跟踪目标以及在所述待跟踪目标的位置标签；步骤S200，基于预训练卷积神经网络模型，获取第一帧中待跟踪目标的不同卷积层的特征；步骤S300，根据所述待跟踪目标的位置标签，构建高斯标签；步骤S400，根据所述高斯标签及步骤S200中得到的不同卷积层的特征，通过相关滤波得到各卷积层的模板；步骤S500，针对新的一帧，在前一帧的中心中裁剪出待搜索区域，基于预训练卷积神经网络模型，利用相关滤波，以及得到的各卷积层的模板，得到各卷积层的响应；步骤S600，将最后一层的卷积层的响应当作一个基础响应，利用空间注意机制以及时间注意机制动态调整其他层的响应的权重；步骤S700，根据调整后的其他层的权重，确定待跟踪目标的所在位置。2.根据权利要求1所述的受丘脑注意机制调控的多层视皮层信息融合的视觉跟踪方法，其特征在于，所述视觉跟踪方法还包括：根据待跟踪目标的所在位置，确定当前帧中的待跟踪目标；基于预训练卷积神经网络模型以及当前帧中的待跟踪目标，确定当前帧中待跟踪目标的不同卷积层的特征，以更新各卷积层的模板。3.根据权利要求1所述的受丘脑注意机制调控的多层视皮层信息融合的视觉跟踪方法，其特征在于，步骤S400中所述卷积层的模板为：其中，Xk是第k个卷积层得到的特征；Y是样本实际的标签，是一个二维的高斯分布，中心值为1是样本的实际位置；F(Xk)表示对Xk进行离散傅里叶变换；F(Y)表示对Y进行离散傅里叶变换；λ表示k个卷积层的响应的权重；d表示第k个卷积层特征的通道序号；*,*,d表示卷积层的第d个通道；表示第k个卷积层第d个通道的模板，表示傅里叶变换的复共轭。4.根据权利要求1所述的受丘脑注意机制调控的多层视皮层信息融合的视觉跟踪方法，其特征在于，步骤S500中所述卷积层的响应为：基于预训练卷积神经网络模型，确定第k层的特征Tk；根据以下公式计算第k层的特征Tk的响应Rk：其中，Rk为第k层的特征Tk的响应Rk；Tk为基于卷积神经网络确定的第k层的特征；F(Tk)表示对Tk进行离散傅里叶变换，表示傅里叶变换的复共轭，F-1表示的离散傅里叶变换的逆变换，Wk表示第k个卷积层的模板模型。5.根据权利要求1所述的受丘脑注意机制调控的多层视皮层信息融合的视觉跟踪方法，其特征在于，所述将最后一层的卷积层的响应当作一个基础响应，利用空间注意机制以及时间注意机制动态调整其他层的响应的权重，具体包括：利用卷积神经网络最后一层的特征进行计算，得到的最后一层响应Rlast：Rlast＝F-1(F(Tlast)·Wlast)；其中，F(Tlast)表示对Tlast进行离散傅里叶变换，表示傅里叶变换的复共轭，F-1表示的离散傅里叶变换的逆变换，Wlast表示最后...

【专利技术属性】
技术研发人员：赵东城，曾毅，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人