一种基于视觉特征合成的对象识别方法技术

技术编号：16129627 阅读：46 留言：0更新日期：2017-09-01 21:15

本发明专利技术中提出的一种基于视觉特征合成的对象识别方法，其主要内容包括：看不见的视觉数据合成、扩散正则化、交替优化、零点识别，其过程为，先通过给定的语义属性来合成看不见的类的视觉特征，再扩散正则化，形成整体损失函数，保留数据结构并使信息扩展到所有维度，接着通过使用交替优化获得局部最优解，最后在获得嵌入矩阵后从语义属性中合成看不见类的视觉特征，应用监督分类器分类。本发明专利技术提出的零点学习框架，可以在不获取真实图像的情况下，对未看到的类进行视觉特征的合成；不仅扩大了分类设置，而且使得各种信息能对视觉系统进行辅助，提高了整体性能，进一步降低合成数据的成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于视觉特征合成的对象识别方法
本专利技术涉及对象识别领域，尤其是涉及了一种基于视觉特征合成的对象识别方法。
技术介绍
对象识别是计算机视觉领域最基础的任务之一，也是难点问题之一。对象识别包括分类和检测两项任务，分类用于判断一幅图像是否包含某类对象，检测则要求标出这些对象的位置和大小。按照描述的概念筛选搜集到的视觉元素，合成视觉特征，用于对象识别。对象识别是理解图像和场景的关键，具有广泛的应用前景，可用于Web图像自动标注、海量图像搜索、图像内容过滤、机器人、安全监视、医学远程会诊等多种领域。对象识别面临很多困难，大多数常规框架，例如深层神经网络(DNN)依靠大量的训练样本来构建统计模型，训练样本的成本太高，而且为了训练而建立一个特定的模型不太现实，收集罕见的实例也很困难。本专利技术提出了一种基于视觉特征合成的对象识别方法，先通过给定的语义属性来合成看不见的类的视觉特征，再扩散正则化，形成整体损失函数，保留数据结构并使信息扩展到所有维度，接着通过使用交替优化获得局部最优解，最后在获得嵌入矩阵后从语义属性中合成看不见类的视觉特征，应用监督分类器分类。本专利技术提...
一种基于视觉特征合成的对象识别方法

【技术保护点】
一种基于视觉特征合成的对象识别方法，其特征在于，主要包括看不见的视觉数据合成(一)；扩散正则化(二)；交替优化(三)；零点识别(四)。

【技术特征摘要】
1.一种基于视觉特征合成的对象识别方法，其特征在于，主要包括看不见的视觉数据合成(一)；扩散正则化(二)；交替优化(三)；零点识别(四)。2.基于权利要求书1所述的看不见的视觉数据合成(一)，其特征在于，通过给定的语义属性来合成看不见的类的视觉特征；在训练集f’上学习一个嵌入函数：之后，可以通过以下方式推断3.基于权利要求书2所述的映射函数，其特征在于，为了合成视觉特征，最直观的框架是学习从语义空间到视觉特征空间的映射函数：其中，P是投影矩阵，是损失函数，Ω是其超参数λ的正则化项；在测试之前，可以通过给定的未知实例的属性从属性空间合成看不见的视觉特征。4.基于权利要求书2所述的协调语义空间与视觉特征空间，其特征在于，引入一个辅助隐藏空间来协调语义空间与视觉特征空间，其中可以让保留视觉和语义空间的内在数据结构信息：其中，潜在嵌入空间从分解，从分解；和是两个投影矩阵；Ω1是对偶图。5.基于权利要求书1所述的扩散正则化(二)，其特征在于，考虑正交旋转，即QQT＝I，有(I是单位矩阵)；从等式(3)中，最佳合成数据为其中首先证明旋转后总体差异不会改变；在旋转之前，是集中的，即的原始总体方差Γ为旋转Q后，有每个维度的新方差为σ′d，每个维度的方差之和为Γ′；总体方差Γ倾向于扩展到所有的学习维度，以便恢复的真实数据分布；根据等式(6)，有在学习框架中最小化Π，找到正交旋转：上式表明，最小化Π相当于最大化扩散标准差的总和；扩散标准偏...

【专利技术属性】
技术研发人员：夏春秋，
申请(专利权)人：深圳市唯特视科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人