面向偏标记数据的数字图像分类方法技术

技术编号：14579770 阅读：129 留言：0更新日期：2017-02-08 10:05

本发明专利技术公开一种用于数字图像的面向偏标记数据的数字图像分类方法，包括初始化正则化因子与参数矩阵；在现有的样例图像上通过求解一个线性规划问题，得到真实标记指派；更新正则化因子并初始化当前目标函数值；根据真实标记指派和正则化因子，通过求解一个多类支持向量机问题，更新分类模型；根据分类模型设置参数矩阵；根据参数矩阵和分类模型，通过求解一个线性规划问题，更新真实标记指派；根据分类模型和真实标记指派，计算新目标函数值等步骤。该方法通过定义自己独有的目标函数，在数字图像对应着由多个标记组成的候选标记集合并且该集合中有且仅有一个真实标记时，可有效地对数字图像进行分类。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数字图像分类方法，特别涉及一种适用于已有图像对应着一个候选标记集合，并且该集合中仅有一个标记为该图像真实标记的情况。
技术介绍
随着互联网的快速发展，数字图像的获得变得越来越容易、在各行业中出现的数字图像的规模也在迅速增长。因此如何对数字图像进行自动化处理变得越来越重要。图像分类技术是一种辅助用户高效地获取期望图像的方法，同时也是很多与图像相关的人机交互系统取得成功的基础，如检索系统、推荐系统等。该方法通过用户提交给分类装置的查询图像，快速、准确地将图像库中的未分类图像进行分类，以方便用户获取期望的图像。一种有效的图像分类策略是将分类过程看作一个学习过程，利用用户提交的查询图像作为学习所需的样本，使用机器学习技术学习得到一个分类模型，从而实现对数字图像的分类。在现实问题中，获得一张图像是较为容易的事情。然而由于问题的特性或成本等原因，对图像进行标记可能是一件较为困难的事情。在真实世界中，已知的图像可能是以偏标记样本的形式给出的：一副图像对应着多个可能的标记组成的候选标记集合，然而这些标记中有且仅有一个标记为该图像的真实标记。比如，在一些新闻网站中，一张新闻图片包含着若干人物的人脸，图片的标题中含有这些人物的姓名。此时，我们通常不能确切地获取人脸和姓名的对应关系，而只能获取一张人脸对应的几个可能的姓名。已有的数字图像分类技术不能有效地处理图像对应一个候选标记集合且真实标记未知的情况，故不能有效地在该场景下进行图像分类。
技术实现思路
本专利技术的主要目的是针对目前的数字图像分类技术需要大量已分类图像且只能将图像分为一个类别的问题，提出一种能够...

【技术保护点】
一种基于偏标记数据的数字图像分类方法，其特征在于包括如下步骤：(1)用户从已有的偏标记图像库中选择样例图像；(2)初始化正则化因子与参数矩阵；(3)在现有的样例图像上通过求解一个线性规划问题，得到真实标记指派；(4)更新正则化因子并初始化当前目标函数值；(5)若正则化因子大于一个阈值，执行步骤(11)；(6)根据真实标记指派和正则化因子，通过求解一个多类支持向量机问题，更新分类模型；(7)根据分类模型设置参数矩阵；(8)根据参数矩阵和分类模型，通过求解一个线性规划问题，更新真实标记指派；(9)根据分类模型和真实标记指派，计算新目标函数值；(10)若新目标函数值与当前目标函数值差异小于一个阈值，执行步骤(4)；否则，将新目标函数值设为当前目标函数值，执行步骤(6)；(11)结束。

【技术特征摘要】
1.一种基于偏标记数据的数字图像分类方法，其特征在于包括如下步骤：(1)用户从已有的偏标记图像库中选择样例图像；(2)初始化正则化因子与参数矩阵；(3)在现有的样例图像上通过求解一个线性规划问题，得到真实标记指派；(4)更新正则化因子并初始化当前目标函数值；(5)若正则化因子大于一个阈值，执行步骤(11)；(6)根据真实标记指派和正则化因子，通过求解一个多类支持向量机问题，更新分类模型；(7)根据分类模型设置参数矩阵；(8)根据参数矩阵和分...

【专利技术属性】
技术研发人员：张敏灵，于菲，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人