当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于预测结果筛选的鲁棒数字图像标注方法技术

技术编号:16129619 阅读:85 留言:0更新日期:2017-09-01 21:15
本发明专利技术公开了一种基于预测结果筛选的鲁棒机器学习方法,用于获得更可靠的数字图像标注结果。具体而言,本发明专利技术采用机器学习中的经典思想——最大化间隔原理,对待标注的数字图像在多种相似度度量下得到的预测结果进行筛选,选取其中间隔最大的结果作为最终预测结果输出,完成对数字图像的标注。预测结果具有大间隔理论上避免了预测结果难以区分的情况,具有不错的鲁棒性。为了显示地计算间隔,本发明专利技术采用机器学习经典损失函数来衡量预测结果的区分程度,从而得到间隔的大小。其中,损失函数指预测结果(连续值)与候选的预测标记(离散值)之间的差距,该损失越小代表了预测结果的间隔越大。

【技术实现步骤摘要】
一种基于预测结果筛选的鲁棒数字图像标注方法
本专利技术涉及一种基于预测结果筛选的鲁棒数字图像标注方法,属于机器学习

技术介绍
随着各类社交网站的广泛流行以及数码产品的大量普及,每时每刻都有海量的数字图像产生并传播。要在如此大规模的图像数据上提供相关服务,一个最核心也是最困难的任务是让计算机自动理解图像的语义,而图像标注则是其中的关键技术。自动图像标注的任务是基于数字图像的视觉特征来预测其语义标记。具体而言,首先从数字图像中抽取视觉特征来表示这些图像示例,然后基于这些特征表示,从已经具有语义标记的图像数据集合中训练出一个标注模型。将待预测标记的数字图像对应的特征表示输入标注模型后,模型就能对它们的语义标记做出预测。传统的数字图像标注技术往往仅利用已经具有语义标记的图像数据,即采用监督学习的方式。然而互联网上存在着大量的原始图像数据,这些数字图像非常容易获取但本身不具有语义标记(即未标记数据)。如何有效地利用大量“便宜的”未标记数据来帮助提高标注模型的性能,具有很强的现实意义,已成为机器学习领域的一个重要研究课题,这类方法称为半监督学习方法。尽管针对数字图像标注的任务,采用半监本文档来自技高网...
一种基于预测结果筛选的鲁棒数字图像标注方法

【技术保护点】
一种基于预测结果筛选的鲁棒数字图像标注方法,其特征在于,主要包括以下步骤:(1)采用多种相似度度量,获得当前待标注图像相关语义标记的多组预测结果;(2)对每组预测结果,应用损失函数计算其间隔大小;(3)选取损失最小(间隔最大)的一组作为最终预测结果,对相应的数字图像进行标注。

【技术特征摘要】
1.一种基于预测结果筛选的鲁棒数字图像标注方法,其特征在于,主要包括以下步骤:(1)采用多种相似度度量,获得当前待标注图像相关语义标记的多组预测结果;(2)对每组预测结果,应用损失函数计算其间隔大小;(3)选取损失最小(间隔最大)的一组作为最终预测结果,对相应的数字图像进行标注。2.如权利要求1所述的基于预测结果筛选的鲁棒数字图像标注方法,其特征在于,数字图像自动标注的步骤为:输入用于训练的数字图像集合,其中既包含带有语义标记的数字图像数据,假设一共有l个,也包含大量待标注的无标记数字图像数据,假设一共有u个;首先对数据集合中的图像提取特征,每个图像由一条特征向量来表示,即xi,i=1,2,...,l,l+1,...,l+u;然后,为带有标记的图像示例生成语义标记位yi∈{±1},i=1,2,...,l,其中,yi=+1表示对应的图像数据带有正的相关语义标记,反之则带有负的相关语义标记;对数据集合中的未标记数据进行标记预测。3.如权利要求2所述的基于预测结果筛选的鲁棒数字图像标注方法,其特征在于,对数据集合中的未标记数据进行标记预测的步骤为:取得机器学习算法所需的数据表示构建多个相似度度量G...

【专利技术属性】
技术研发人员:李宇峰王少博周志华
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1