The invention discloses a convolution neural network tracking method combining the Gauss kernel function. The method includes: first, the first frame image is normalized and the target information is extracted, and the target background information in the tracking process is used as the order filter in the convolution network structure, and the Gauss kernel function is used to extract the target information. High convolution operation speed, extract the simple abstract feature of the target, and then superpose the convolution result of simple layer to get the deep level expression of the target, and finally combine the particle filter tracking frame to realize the tracking. The simplified convolution network structure can effectively cope with low resolution, target occlusion and deformation, and improve the tracking efficiency in complex background.
【技术实现步骤摘要】
一种结合高斯核函数的卷积神经网络跟踪方法
本专利技术涉及计算机视觉的目标跟踪领域,特别是一种结合高斯核函数的卷积神经网络跟踪方法。
技术介绍
视觉跟踪是计算机视觉领域的研究热点,在虚拟现实、人机交互、智能监控、增强现实、机器感知等场景中有着重要的研究与应用价值。视觉跟踪主要通过分析视频图片序列,对检测出的各个候选目标区域实施匹配,定位跟踪目标在视频序列中的位置。目前跟踪算法已经取得很多研究成果,但在实际中应对各类复杂场景时仍面临很大挑战,例如面对遮挡、形变、视频序列分辨率低等诸多因素影响时,如何实现更加鲁棒和准确的跟踪仍然是目前研究的核心。传统跟踪算法大多数直接使用视频图像序列中的像素值特征进行建模,当跟踪过程中出现复杂场景等较大挑战时,浅层的像素级特征无法很好应对。因此,本专利技术人对其进一步的探索和研究,提出一种结合高斯核函数的卷积神经网络跟踪方法。
技术实现思路
为了解决深度学习在跟踪领域的问题,本专利技术提出结合高斯核函数的卷积神经网络跟踪方法:本专利技术提出一种结合高斯核函数的卷积神经网络跟踪方法,包括以下步骤:步骤1、初始化:包括针对各帧图像的归一化,粒子 ...
【技术保护点】
一种结合高斯核函数的卷积神经网络跟踪方法,其特征在于,包括以下步骤:步骤1、初始化:包括针对各帧图像的归一化,粒子滤波,网络规模和样本容量这些参数的设置;且设置的参数包括滤波网络取片尺寸w*w,滤波器数P,归一化尺寸n*n,粒子滤波器的目标状态的标准偏差σx,σy,σs以及使用N个粒子;步骤2、初始滤波器提取:针对第一帧图像的目标,通过滑动窗口和K‑means聚类提取一个初始滤波器组用以后续网络的滤波器使用,在跟踪过程中此滤波器组保持不变;步骤3、根据卷积神经网络结构,先提取各候选样本的深层抽象特征,再利用高斯核函数方式加速卷积计算,其具体包括:步骤31、简单层特征提取:针 ...
【技术特征摘要】
1.一种结合高斯核函数的卷积神经网络跟踪方法,其特征在于,包括以下步骤:步骤1、初始化:包括针对各帧图像的归一化,粒子滤波,网络规模和样本容量这些参数的设置;且设置的参数包括滤波网络取片尺寸w*w,滤波器数P,归一化尺寸n*n,粒子滤波器的目标状态的标准偏差σx,σy,σs以及使用N个粒子;步骤2、初始滤波器提取:针对第一帧图像的目标,通过滑动窗口和K-means聚类提取一个初始滤波器组用以后续网络的滤波器使用,在跟踪过程中此滤波器组保持不变;步骤3、根据卷积神经网络结构,先提取各候选样本的深层抽象特征,再利用高斯核函数方式加速卷积计算,其具体包括:步骤31、简单层特征提取:针对输入图像帧,通过预处理将图像归一化到n*n大小,对目标区域利用w*w大小的滑动窗口进行采样,得到长度为L的图像块组X;步骤32、用k-means聚类的方法从L=(n-w+1)×(n-w+1)个图像块中聚类得到d个图像块滤波器作为卷积核,将卷积核记作步骤33、对输入的图像I所对应的响应如公式(1)所示:其中,S为第一层卷积结果,F为卷积核;步骤34、对图像的目标周围的区域随机采样得到个样本,同样进行k-means聚类获得图像的背景模板:步骤35、采用均值池化方式处理所有图像的背景模板得到平均背景:其中,Fb为背景卷积核,b是标明为背景,d是获取一组背景模板的总个数,m为平均池化操作的参数;步骤36、简单层的特征表达如公式(2)所示:步骤37、复杂层特征提取:将d个简单层的特征进行堆叠,构成一个三维张量来表示目标的复杂层特征,并将该复杂层特征记作C∈R(n-w+1)×(n-w+1)×d;步骤38、采用稀疏表达的方式表示特征得到特征张量的C的稀疏表达,且步骤39、根据soft-shrinking方法获得目标特征表达如公式(3)所示:步骤310、利用高斯核函数进行卷积运算,其表达式如下公式(...
【专利技术属性】
技术研发人员:汪鸿翔,柳培忠,顾培婷,刘晓芳,陈智,范宇凌,
申请(专利权)人:华侨大学,泉州市中仿宏业信息科技有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。