物体识别追踪方法技术

技术编号：16080442 阅读：63 留言：0更新日期：2017-08-25 15:44

本发明专利技术公开了一种物体识别追踪方法，提出一种消费级视频内物体识别及追踪的方法，该方法包含两个阶段，在第一阶段使用神经网络快速从视频中检测出物体的位置并识别出该物体类别，分割出物体区域送入第二阶段处理，第二阶段对物体进行跟踪；本发明专利技术提供的物体识别追踪方法，使用物体识别追踪系统从输入图像中快速准确地识别出该物体类别及对它定位跟踪；物体识别追踪系统的核心问题在于从输入视频中检测出物体的类别以及精确位置，然后进行跟踪。

全部详细技术资料下载

【技术实现步骤摘要】
物体识别追踪方法
本专利技术涉及一种物体识别追踪方法，具体的是从输入图像中快速准确地识别出该物体类别及对它定位跟踪。
技术介绍
深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。深度学习的概念源于人工神经网络的研究，含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来希望，随后提出多层自动编码器深层结构。此外Lecun等人提出的基于区域的卷积神经网络是第一个真正多层结构的学习算法，它利用空间相对关系减少参数数目以提高训练性能。深度学习的实质，是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。因此，“深度模型”是手段，“特征学习”是目的。区别于传统的浅层学习，深度学习的不同在于：1)强调了模型结构的深度，通常有5...
物体识别追踪方法

【技术保护点】
一种物体识别追踪方法，其特征在于：1)对输入视频预处理；处理步骤为视频解码，视频图像化，图像归一化；2)利用神经网络对视频图片进行检测识别；步骤一：输入图像；由1)中采集的图像送入步骤二；步骤二：检测目标区域；步骤一中的图像会经过提取候选框，即目标区域的网络，提取感兴趣的区域；步骤三：识别物体类别；本步骤对步骤二中的候选框的内容进行识别分类；采用改进的ZF网络，使用适合网络大小的图片作为输入，网络的每一层是一个大小为w×h×d的三维矩阵，其中h和w代表图像的高度和宽度，d是滤波器的个数或者信道维数，利用上述三维矩阵得出网络每一层的神经单元个数；网络的输入为w×h×d维；网络每一层的输出计算公式...

【技术特征摘要】
1.一种物体识别追踪方法，其特征在于：1)对输入视频预处理；处理步骤为视频解码，视频图像化，图像归一化；2)利用神经网络对视频图片进行检测识别；步骤一：输入图像；由1)中采集的图像送入步骤二；步骤二：检测目标区域；步骤一中的图像会经过提取候选框，即目标区域的网络，提取感兴趣的区域；步骤三：识别物体类别；本步骤对步骤二中的候选框的内容进行识别分类；采用改进的ZF网络，使用适合网络大小的图片作为输入，网络的每一层是一个大小为w×h×d的三维矩阵，其中h和w代表图像的高度和宽度，d是滤波器的个数或者信道维数，利用上述三维矩阵得出网络每一层的神经单元个数；网络的输入为w×h×d维；网络每一层的输出计算公式为：其中：ho为输出图像高度，hi为输入图像高度；pad为填充大小，指定在每次输入的图像的每一边加上多少个像素；kernel_size为卷积核大小；stride为步长，指滤波器滤波时候的滑动步长，即指定每次间隔几个像素值进行滤波；输出宽度wo采用同样的方法计算；步骤四：计算神经网络特征，经过softmax分类器进行分类从而生成C个物体类别的概率；又由于每个候选框的位置在步骤一中就会给出，至此，识别以及定位结束；3)通过物体跟踪模块跟踪；识别出物体的图片帧输入到检测识别模块中，同时输入识别出的物体位置及类别信息，在这一帧就初始化跟踪器，并且在接下来的视频序列中对这个检测到的物体进行跟踪，直到发生跟踪丢失的情况或者发生了镜头切换，至此一个跟踪序列结束；4)进行投票操作；2)与3)中既有检测结果又有跟踪结果，那么就牵扯到融合，在融合之后，便得到了一个个物体识别序列，为了得...

【专利技术属性】
技术研发人员：张飞云，
申请(专利权)人：上海极链网络科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人