一种多视图图像自动标注方法技术

技术编号：18289654 阅读：58 留言：0更新日期：2018-06-24 04:25

本发明专利技术公开了一种多视图图像自动标注方法，包括步骤有：(1)设置已标注图像的语义标签和多种视觉特征作为多种视图，输入到多视图稀疏模型中进行训练学习，得到各视图字典和各视图权值因子；(2)输入待标注图像的多种视觉特征；(3)利用所述各视图字典和所述各视图权值因子稀疏重构所述待标注图像，计算得到标签视图的稀疏重构系数；(4)将所述标签视图字典和所述标签视图的稀疏重构系数相乘，得到待标注图像语义标签的分值；(5)将分值从高到低排列，选择前5个语义标签标注所述待标注图像。本发明专利技术改善了计算机的自动图像标注性能，提高自动标注的查准率和查全率。

全部详细技术资料下载

【技术实现步骤摘要】
一种多视图图像自动标注方法
本专利技术涉图像处理领域，尤其涉及一种多视图图像自动标注方法。
技术介绍
随着多媒体信息技术的迅猛发展，对海量图像数据库的有效管理与检索日益成为人们亟待解决的问题。目前，基于文本的图像检索方法仍然是许多图像搜素引擎检索相关图像的重要方法。因此，如果事先为图像分配反映其语义内容的关键词，将大大提高图像检索的准确性和效率。自动图像标注就是让计算机自动智能的完成这一任务。它利用已标注图像集或其他可获得的先验信息自动学习语义概念空间与视觉特征空间的映射关系，并利用这一关系来标注未知语义的图像。该任务难点在于图像的高层语义内容和底层视觉特征之间并不总是相关的，即存在语义鸿沟。现有的基于最近邻的图像标注方法取得了卓越的成绩，但由于测试过程需要与所有训练样本逐一比对带来较大运算量。多视图稀疏编码是图像自动标注中一个重要分支，但现有方法中各视图往往共享相同的稀疏系数，忽略了不同视图的差异性。如何有效利用各视图的相似性和差异性，提高图像自动标注性能还有待进一步研究。
技术实现思路
针对上述现有技术存在的缺陷，本专利技术提供一种多视图图像自动标注方法，增强了计算机的自动图像标注性能。本专利技术提供的一种多视图图像自动标注方法，其改进之处在于，所述方法包括如下步骤：(1)设置已标注图像的语义标签和多种视觉特征作为多种视图，输入到多视图稀疏模型中进行训练学习，得到各视图字典和各视图权值因子；所述各视图字典包括多个视觉特征视图字典和一个标签视图字典；(2)输入待标注图像的多种视觉特征；(3)利用所述各视图字典和所述各视图权值因子稀疏重构所述待标注图像，计算得...
一种多视图图像自动标注方法

【技术保护点】
1.一种多视图图像自动标注方法，其特征在于，所述方法包括如下步骤：(1)设置已标注图像的语义标签和多种视觉特征作为多种视图，输入到多视图稀疏模型中进行训练学习，得到各视图字典和各视图权值因子；所述各视图字典包括多个视觉特征视图字典和一个标签视图字典；(2)输入待标注图像的多种视觉特征；(3)利用所述各视图字典和所述各视图权值因子稀疏重构所述待标注图像，计算得到标签视图的稀疏重构系数；(4)将所述标签视图字典和所述标签视图的稀疏重构系数相乘，得到待标注图像语义标签的分值；(5)将分值从高到低排列，选择前5个语义标签标注所述待标注图像。

【技术特征摘要】
1.一种多视图图像自动标注方法，其特征在于，所述方法包括如下步骤：(1)设置已标注图像的语义标签和多种视觉特征作为多种视图，输入到多视图稀疏模型中进行训练学习，得到各视图字典和各视图权值因子；所述各视图字典包括多个视觉特征视图字典和一个标签视图字典；(2)输入待标注图像的多种视觉特征；(3)利用所述各视图字典和所述各视图权值因子稀疏重构所述待标注图像，计算得到标签视图的稀疏重构系数；(4)将所述标签视图字典和所述标签视图的稀疏重构系数相乘，得到待标注图像语义标签的分值；(5)将分值从高到低排列，选择前5个语义标签标注所述待标注图像。2.如权利要求1所述的多视图图像自动标注方法，其特征在于，步骤(1)在进行训练学习前，对所述稀疏模型的目标函数进行修正，设置各视图使用不同的稀疏系数，增设加权的一致性正则项，得到修正后的目标函数，其表达式为：式中，v为视图序号，v＝1,2,…,V+1；V为视觉特征数目；X(v)为所有训练图像第v个视图的特征矩阵，N为训练图像数目，Pv为第v个视图的特征维度；D(v)为第v个视图字典，Nd为字典原子数目；α(v)为第v个视图的稀疏系数矩阵，F为Frobenius范数；||α(v)||1，∞为控制稀疏系数各行之间稀疏性的正则项；||(D(v))T||1,∞为控制字典结构各列之间稀疏性的正则项；为一致矩阵；为控制各视图稀疏系数矩阵和一致矩阵之间不一致性的正则项；ω(v)为第v个视图的权值因子，取值归一化在[0,1]范围内，且其中σ是熵的限制值；λ1为稀疏系数正则项的调节系数；λ2为稀疏字典正则项的调节系数；λ3为一致正则项的调节系数。3.如权利要求1所述的多视图图像自动标注方法，其特征在于，步骤(1)所述多种视觉特征包括手工设计特征和基于VGG的深...

【专利技术属性】
技术研发人员：臧淼，
申请(专利权)人：北方工业大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人