一种图像标记方法及电子设备技术

技术编号：24206717 阅读：36 留言：0更新日期：2020-05-20 14:58

本发明专利技术提供了一种图像标记方法及电子设备，涉及图像挖掘技术领域，主要解决了对图像进行精准描述的技术问题。该发明专利技术包括：获取待标记图像的标签集，所述标签集包括至少一个所述图像的已有标签；对所述标签集内的标签进行过滤，得到过滤后的标签；根据所述过滤后的标签，计算标签间的视觉相似度矩阵和语义相似度矩阵；根据所述视觉相似度矩阵和语义相似度矩阵计算混合相似度矩阵，并对所述混合相似度矩阵进行聚类，得到所述待标记图像的视觉主题，所述视觉主题包括至少一个所述过滤后的标签；采用所述视觉主题标记所述待标记图像。因此，本发明专利技术不需要引入额外的数据来训练，充分利用公开的预训练算法模型；具有操作性强，计算速度快，效果好特点。

An image marking method and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
一种图像标记方法及电子设备
本专利技术涉及图像挖掘
，尤其涉及一种图像标记方法及电子设备。
技术介绍
互联网技术的飞速发展使得人们越来越喜爱将自己的生活与见闻拍摄图片或视频发布在各大社交网站上。在网站上存储的海量图像数据中，图像对应的用户标签在描述图像内容、方便用户检索兴趣图像方面起着举足轻重的作用。然而，由于每个人描述和看待事物的角度不同，往往会有不同的标签描述相似图像的现象出现，这给图像存储和处理的网站服务器产生了很大的压力。此外，并且所有的标签都与特定的视觉内容有比较强的关联，如“棒极了”、“漂亮”之类的标签，无法将之与很具体的图像联系起来，然而这类标签却经常出现在各大社交网站之中。社交网络为了方便图像的存储和检索，会将图像与对应的标签进行特征的描述和编码，用来存储在数据服务器上提供服务。在图像标签的编码方式上一般采用“一位独热”编码方式(one-hotencoding)，即将所有独立的标签作为一个整体的序列进行排列。例如给定一幅图像，它的标签描述编码就是一个很长的数字序列，若图像中包含某几个标签，则序列中对应的标签位置的数值为1，其余位置数值为0。给定一个图像的集合，那么生成的标签编码序列就是一个非常稀疏的编码矩阵(encodingmatrix)，矩阵里只有少量位置值为1，大部分位置的数值都为0。存储和处理这样的矩阵对于计算机来说耗时耗力，并且对于图像和标签的处理算法也带来了较大的困难。有一些工作尝试使用降维方法减少图像标签的数量，从而降低标签编码矩阵的维度，然而此类方法只是基于概率上的理论，而...

【技术保护点】
1.一种图像标记方法，其特征在于，包括：/n获取待标记图像的标签集，所述标签集包括至少一个所述图像的已有标签；/n对所述标签集内的标签进行过滤，得到过滤后的标签；/n根据所述过滤后的标签，计算标签间的视觉相似度矩阵和语义相似度矩阵；/n根据所述视觉相似度矩阵和语义相似度矩阵计算混合相似度矩阵，并对所述混合相似度矩阵进行聚类，得到所述待标记图像的视觉主题，所述视觉主题包括至少一个所述过滤后的标签；/n采用所述视觉主题标记所述待标记图像。/n

【技术特征摘要】
1.一种图像标记方法，其特征在于，包括：
获取待标记图像的标签集，所述标签集包括至少一个所述图像的已有标签；
对所述标签集内的标签进行过滤，得到过滤后的标签；
根据所述过滤后的标签，计算标签间的视觉相似度矩阵和语义相似度矩阵；
根据所述视觉相似度矩阵和语义相似度矩阵计算混合相似度矩阵，并对所述混合相似度矩阵进行聚类，得到所述待标记图像的视觉主题，所述视觉主题包括至少一个所述过滤后的标签；
采用所述视觉主题标记所述待标记图像。

2.根据权利要求1所述的图像标记方法，其特征在于，所述对所述标签集内的标签进行过滤，得到过滤后的标签，包括：
获取所述标签集内的各个标签对应的VCDL，所述VCDL根据各个标签和所述各个标签已标记的图像集确定；其中，VCDL为视觉内容描述级别，用于衡量标签的描述能力；
在所述标签集内去除低于预设阈值的VCDL对应的标签，得到过滤后的标签。

3.根据权利要求2所述的图像标记方法，其特征在于，所述获取所述标签集内的各个标签对应的VCDL，包括：
分别将所述标签集内的各个标签作为当前标签，获取所述当前标签已标记的图像集，所述图像集包括至少一个图像；
分别将所述图像集中的各个图像作为当前图像，根据图像的视觉特征，采用K近邻算法，确定所述当前图像的K个近邻图像；
根据所述K个近邻图像和所述当前标签，计算所述当前图像与其他图像的相似度值；
根据所述相似度值确定所述当前标签对应的VCDL。

4.根据权利要求3所述的图像标记方法，其特征在于，所述根据所述相似度值确定所述当前标签对应的VCDL，包括：
将所述当前标签对应的出现次数最多的所述相似度值，确定为所述当前标签对应的VCDL。

5.根据权利要求1所述的图像标记方法，其特征在于，所述根据所述过滤后的标签，计算标签间的视觉相似度矩阵和语义相似度矩阵，包括：
对所述过滤后的标签进行两两计算，得到两个过滤后的标签之间的豪斯多夫距离，并将每个所述豪斯多夫距离作为一个元素值，生成视觉距离...

【专利技术属性】
技术研发人员：孙科，储朱涛，贺鹏飞，王文强，何彩洋，施佳，
申请(专利权)人：杭州创匠信息科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人