【技术实现步骤摘要】
一种基于视觉特征合成的对象识别方法
本专利技术涉及对象识别领域,尤其是涉及了一种基于视觉特征合成的对象识别方法。
技术介绍
对象识别是计算机视觉领域最基础的任务之一,也是难点问题之一。对象识别包括分类和检测两项任务,分类用于判断一幅图像是否包含某类对象,检测则要求标出这些对象的位置和大小。按照描述的概念筛选搜集到的视觉元素,合成视觉特征,用于对象识别。对象识别是理解图像和场景的关键,具有广泛的应用前景,可用于Web图像自动标注、海量图像搜索、图像内容过滤、机器人、安全监视、医学远程会诊等多种领域。对象识别面临很多困难,大多数常规框架,例如深层神经网络(DNN)依靠大量的训练样本来构建统计模型,训练样本的成本太高,而且为了训练而建立一个特定的模型不太现实,收集罕见的实例也很困难。本专利技术提出了一种基于视觉特征合成的对象识别方法,先通过给定的语义属性来合成看不见的类的视觉特征,再扩散正则化,形成整体损失函数,保留数据结构并使信息扩展到所有维度,接着通过使用交替优化获得局部最优解,最后在获得嵌入矩阵后从语义属性中合成看不见类的视觉特征,应用监督分类器分类。本专利技术提 ...
【技术保护点】
一种基于视觉特征合成的对象识别方法,其特征在于,主要包括看不见的视觉数据合成(一);扩散正则化(二);交替优化(三);零点识别(四)。
【技术特征摘要】
1.一种基于视觉特征合成的对象识别方法,其特征在于,主要包括看不见的视觉数据合成(一);扩散正则化(二);交替优化(三);零点识别(四)。2.基于权利要求书1所述的看不见的视觉数据合成(一),其特征在于,通过给定的语义属性来合成看不见的类的视觉特征;在训练集f’上学习一个嵌入函数:之后,可以通过以下方式推断3.基于权利要求书2所述的映射函数,其特征在于,为了合成视觉特征,最直观的框架是学习从语义空间到视觉特征空间的映射函数:其中,P是投影矩阵,是损失函数,Ω是其超参数λ的正则化项;在测试之前,可以通过给定的未知实例的属性从属性空间合成看不见的视觉特征。4.基于权利要求书2所述的协调语义空间与视觉特征空间,其特征在于,引入一个辅助隐藏空间来协调语义空间与视觉特征空间,其中可以让保留视觉和语义空间的内在数据结构信息:其中,潜在嵌入空间从分解,从分解;和是两个投影矩阵;Ω1是对偶图。5.基于权利要求书1所述的扩散正则化(二),其特征在于,考虑正交旋转,即QQT=I,有(I是单位矩阵);从等式(3)中,最佳合成数据为其中首先证明旋转后总体差异不会改变;在旋转之前,是集中的,即的原始总体方差Γ为旋转Q后,有每个维度的新方差为σ′d,每个维度的方差之和为Γ′;总体方差Γ倾向于扩展到所有的学习维度,以便恢复的真实数据分布;根据等式(6),有在学习框架中最小化Π,找到正交旋转:上式表明,最小化Π相当于最大化扩散标准差的总和;扩散标准偏...
【专利技术属性】
技术研发人员:夏春秋,
申请(专利权)人:深圳市唯特视科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。