一种基于视觉特征合成的对象识别方法技术

技术编号:16129627 阅读:46 留言:0更新日期:2017-09-01 21:15
本发明专利技术中提出的一种基于视觉特征合成的对象识别方法,其主要内容包括:看不见的视觉数据合成、扩散正则化、交替优化、零点识别,其过程为,先通过给定的语义属性来合成看不见的类的视觉特征,再扩散正则化,形成整体损失函数,保留数据结构并使信息扩展到所有维度,接着通过使用交替优化获得局部最优解,最后在获得嵌入矩阵后从语义属性中合成看不见类的视觉特征,应用监督分类器分类。本发明专利技术提出的零点学习框架,可以在不获取真实图像的情况下,对未看到的类进行视觉特征的合成;不仅扩大了分类设置,而且使得各种信息能对视觉系统进行辅助,提高了整体性能,进一步降低合成数据的成本。

【技术实现步骤摘要】
一种基于视觉特征合成的对象识别方法
本专利技术涉及对象识别领域,尤其是涉及了一种基于视觉特征合成的对象识别方法。
技术介绍
对象识别是计算机视觉领域最基础的任务之一,也是难点问题之一。对象识别包括分类和检测两项任务,分类用于判断一幅图像是否包含某类对象,检测则要求标出这些对象的位置和大小。按照描述的概念筛选搜集到的视觉元素,合成视觉特征,用于对象识别。对象识别是理解图像和场景的关键,具有广泛的应用前景,可用于Web图像自动标注、海量图像搜索、图像内容过滤、机器人、安全监视、医学远程会诊等多种领域。对象识别面临很多困难,大多数常规框架,例如深层神经网络(DNN)依靠大量的训练样本来构建统计模型,训练样本的成本太高,而且为了训练而建立一个特定的模型不太现实,收集罕见的实例也很困难。本专利技术提出了一种基于视觉特征合成的对象识别方法,先通过给定的语义属性来合成看不见的类的视觉特征,再扩散正则化,形成整体损失函数,保留数据结构并使信息扩展到所有维度,接着通过使用交替优化获得局部最优解,最后在获得嵌入矩阵后从语义属性中合成看不见类的视觉特征,应用监督分类器分类。本专利技术提出的零点学习框架,可本文档来自技高网...
一种基于视觉特征合成的对象识别方法

【技术保护点】
一种基于视觉特征合成的对象识别方法,其特征在于,主要包括看不见的视觉数据合成(一);扩散正则化(二);交替优化(三);零点识别(四)。

【技术特征摘要】
1.一种基于视觉特征合成的对象识别方法,其特征在于,主要包括看不见的视觉数据合成(一);扩散正则化(二);交替优化(三);零点识别(四)。2.基于权利要求书1所述的看不见的视觉数据合成(一),其特征在于,通过给定的语义属性来合成看不见的类的视觉特征;在训练集f’上学习一个嵌入函数:之后,可以通过以下方式推断3.基于权利要求书2所述的映射函数,其特征在于,为了合成视觉特征,最直观的框架是学习从语义空间到视觉特征空间的映射函数:其中,P是投影矩阵,是损失函数,Ω是其超参数λ的正则化项;在测试之前,可以通过给定的未知实例的属性从属性空间合成看不见的视觉特征。4.基于权利要求书2所述的协调语义空间与视觉特征空间,其特征在于,引入一个辅助隐藏空间来协调语义空间与视觉特征空间,其中可以让保留视觉和语义空间的内在数据结构信息:其中,潜在嵌入空间从分解,从分解;和是两个投影矩阵;Ω1是对偶图。5.基于权利要求书1所述的扩散正则化(二),其特征在于,考虑正交旋转,即QQT=I,有(I是单位矩阵);从等式(3)中,最佳合成数据为其中首先证明旋转后总体差异不会改变;在旋转之前,是集中的,即的原始总体方差Γ为旋转Q后,有每个维度的新方差为σ′d,每个维度的方差之和为Γ′;总体方差Γ倾向于扩展到所有的学习维度,以便恢复的真实数据分布;根据等式(6),有在学习框架中最小化Π,找到正交旋转:上式表明,最小化Π相当于最大化扩散标准差的总和;扩散标准偏...

【专利技术属性】
技术研发人员:夏春秋
申请(专利权)人:深圳市唯特视科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1