当前位置: 首页 > 专利查询>东南大学专利>正文

面向偏标记数据的数字图像分类方法技术

技术编号:14579770 阅读:129 留言:0更新日期:2017-02-08 10:05
本发明专利技术公开一种用于数字图像的面向偏标记数据的数字图像分类方法,包括初始化正则化因子与参数矩阵;在现有的样例图像上通过求解一个线性规划问题,得到真实标记指派;更新正则化因子并初始化当前目标函数值;根据真实标记指派和正则化因子,通过求解一个多类支持向量机问题,更新分类模型;根据分类模型设置参数矩阵;根据参数矩阵和分类模型,通过求解一个线性规划问题,更新真实标记指派;根据分类模型和真实标记指派,计算新目标函数值等步骤。该方法通过定义自己独有的目标函数,在数字图像对应着由多个标记组成的候选标记集合并且该集合中有且仅有一个真实标记时,可有效地对数字图像进行分类。

【技术实现步骤摘要】

本专利技术涉及一种数字图像分类方法,特别涉及一种适用于已有图像对应着一个候选标记集合,并且该集合中仅有一个标记为该图像真实标记的情况。
技术介绍
随着互联网的快速发展,数字图像的获得变得越来越容易、在各行业中出现的数字图像的规模也在迅速增长。因此如何对数字图像进行自动化处理变得越来越重要。图像分类技术是一种辅助用户高效地获取期望图像的方法,同时也是很多与图像相关的人机交互系统取得成功的基础,如检索系统、推荐系统等。该方法通过用户提交给分类装置的查询图像,快速、准确地将图像库中的未分类图像进行分类,以方便用户获取期望的图像。一种有效的图像分类策略是将分类过程看作一个学习过程,利用用户提交的查询图像作为学习所需的样本,使用机器学习技术学习得到一个分类模型,从而实现对数字图像的分类。在现实问题中,获得一张图像是较为容易的事情。然而由于问题的特性或成本等原因,对图像进行标记可能是一件较为困难的事情。在真实世界中,已知的图像可能是以偏标记样本的形式给出的:一副图像对应着多个可能的标记组成的候选标记集合,然而这些标记中有且仅有一个标记为该图像的真实标记。比如,在一些新闻网站中,一张新闻图片包含着若干人物的人脸,图片的标题中含有这些人物的姓名。此时,我们通常不能确切地获取人脸和姓名的对应关系,而只能获取一张人脸对应的几个可能的姓名。已有的数字图像分类技术不能有效地处理图像对应一个候选标记集合且真实标记未知的情况,故不能有效地在该场景下进行图像分类。
技术实现思路
本专利技术的主要目的是针对目前的数字图像分类技术需要大量已分类图像且只能将图像分为一个类别的问题,提出一种能够处理图像对应一个候选标记集合且真实标记未知时的分类方法。为利用偏标记数字图像且对数字图像的所有可能类别进行分类,本专利技术引入了机器学习领域中的最大间隔准则,进而提出一种基于偏标记数据的数字图像分类方法:该方法包括以下步骤:(1)用户从已有的偏标记图像库中选择样例图像;(2)初始化正则化因子与参数矩阵;(3)在现有的样例图像上通过求解一个线性规划问题,得到真实标记指派;(4)更新正则化因子并初始化当前目标函数值;(5)若正则化因子大于一个阈值,执行步骤(11);(6)根据真实标记指派和正则化因子,通过求解一个多类支持向量机问题,更新分类模型;(7)根据分类模型设置参数矩阵;(8)根据参数矩阵和分类模型,通过求解一个线性规划问题,更新真实标记指派;(9)根据分类模型和真实标记指派,计算新目标函数值;(10)若新目标函数值与当前目标函数值差异小于一个阈值,执行步骤(4);否则,将新目标函数值设为当前目标函数值,执行步骤(6);(11)结束。本专利技术有益效果:本专利技术给出了一种用于数字图像是偏标记样本形式时的分类方法,该方法通过定义自己独有的目标函数,在数字图像对应着由多个标记组成的候选标记集合并且该集合中有且仅有一个真实标记时,可有效地对数字图像进行分类。下面将结合附图对最佳实施例进行详细说明。附图说明图1是数字图像分类装置的工作流程图图2是本专利技术方法的流程图图3是本专利技术学习分类模型的流程图具体实施方式如图1所示,数字图像存储设备中存放了待分类的数字图像,此外还存在一个偏标记图像库,该图像库中的每个数字图像均对应了一组人工标注的概念标记集合,而该集合中有且仅有一个标记为该图像的真实标记。用户从偏标记数字图像库中选择M幅图像提交给数字图像分类装置,选取的样例图像应尽可能涵盖各个类别。每幅图像可使用数字图像处理教科书中的多种经典方法生成适当的图像特征,由此,每幅图像可由一个特征向量进行表示。在得到图像特征后,使用本专利技术提出的分类方法可得到一个基于偏标记图像样本的分类模型。基于最终分类模型对数字图像存储设备中的待分类图像进行分类,如图1所示。如果用户对所得结果不满意,可以从偏标记数字图像库中选取更多的查询图像反馈给数字图像分类装置。本专利技术涉及的方法如图2所示。值得注意的是,本专利技术中提出的图像分类方法由q个线性模型Θ={(wp,bp)|1≤p≤q}组成,其中:q为所有可能的图像类别个数,wp与bp为线性模型与第p个类别对应的权值向量和偏置。步骤10是起始动作。假设用户提交的查询图像对应于集合其中:m为查询图像的个数,为图像Xi对应的候选标记集合,图像Xi的真实标记yi未知但满足yi∈Si。本专利技术的任务是基于图像集合得到一个由输入空间映射至标记空间的多类分类器步骤11是本专利技术得到多类分类模型的过程,其详细说明如图3所示。步骤12利用训练得到的最终分类模型,对数字图像存储设备中的待分类图像进行分类。在输出分类结果后,分类装置即进入步骤13所示的结束状态。具体来说,本专利技术中提出的分类方法通过优化以下目标函数,从而得到最终分类模型:miny,Θ,ξ12Σp=1q||wp||2+CΣi=1mξi]]>ξi≥0∀i∈{1,2,...,m本文档来自技高网...

【技术保护点】
一种基于偏标记数据的数字图像分类方法,其特征在于包括如下步骤:(1)用户从已有的偏标记图像库中选择样例图像;(2)初始化正则化因子与参数矩阵;(3)在现有的样例图像上通过求解一个线性规划问题,得到真实标记指派;(4)更新正则化因子并初始化当前目标函数值;(5)若正则化因子大于一个阈值,执行步骤(11);(6)根据真实标记指派和正则化因子,通过求解一个多类支持向量机问题,更新分类模型;(7)根据分类模型设置参数矩阵;(8)根据参数矩阵和分类模型,通过求解一个线性规划问题,更新真实标记指派;(9)根据分类模型和真实标记指派,计算新目标函数值;(10)若新目标函数值与当前目标函数值差异小于一个阈值,执行步骤(4);否则,将新目标函数值设为当前目标函数值,执行步骤(6);(11)结束。

【技术特征摘要】
1.一种基于偏标记数据的数字图像分类方法,其特征在于包括如下步骤:(1)用户从已有的偏标记图像库中选择样例图像;(2)初始化正则化因子与参数矩阵;(3)在现有的样例图像上通过求解一个线性规划问题,得到真实标记指派;(4)更新正则化因子并初始化当前目标函数值;(5)若正则化因子大于一个阈值,执行步骤(11);(6)根据真实标记指派和正则化因子,通过求解一个多类支持向量机问题,更新分类模型;(7)根据分类模型设置参数矩阵;(8)根据参数矩阵和分...

【专利技术属性】
技术研发人员:张敏灵于菲
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1