This invention discloses an automatic image tagging method and device based on data smoothing. By using the cross media correlation model as an automatic annotation model based on the content of the image, the probability of each keyword as the image annotation is obtained by using the probability and statistics method. The model has achieved good results in the field of image annotation. As a result, it is also a relatively stable method. Therefore, on the basis of the cross media related model data smoothing, the present invention extracts more robust features, invents an image semantic annotation method with higher efficiency and higher accuracy, and solves the problem of \semantic gap\ to a certain extent and solves the problem at the same time. In the traditional semantic annotation, the process of keyword description for each image by artificial means saves manpower and time cost, and has a high application prospect.
【技术实现步骤摘要】
一种基于数据平滑的图像语义自动标注方法及装置
本专利技术涉及计算机
,尤其涉及一种基于数据平滑的图像语义自动标注方法及装置。
技术介绍
随着数字影像技术与互联网技术的迅速发展,互联网上有约数以百亿的图像,并且每天都在以数百万的速度增长。如何设计一种从海量图片中快速有效地检索出用户需要的图片的方法有着巨大的现实意义,这也是图像检索领域关注的内容。图像语义自动标注是指利用计算机视觉技术,让计算机对图像中的内容进行理解,从而给图像自动标注出文本语义的过程。也就是说,图像语义自动标注是让计算机对图像的语义进行准确地描述和理解的过程,其本质上就是建立图像和文本语义之间的关联。图像语义自动标注通常用于图像检索、图像分类和相册管理等不同的场景。图像语义标注已经成为图像检索中的研究热点。通过图像语义标注就可以将图像的检索问题转化为技术成熟、效率高的文本检索问题。但是传统的语义标注是通过人工的方式对每幅图像进行关键词描述,在现在数据爆炸的时代这种方式显然是既费时效率又低。目前,现有的图像语义自动标注的方法存在以下三点问题:1)、现有的图像语义在动标注犯法是将图像的语义标注作为分类问题来解决的,通常需要人工事先选择、标注语义类别,才能训练语义分类器。因此,对每个类别进行图像的人工标注费时费力,并且其无法穷尽整个语义空间,导致图像的语义描述很不完整;2)、每个语义类别均对应一个语义分类器,在对图像进行语义标注时,需要将所有的语义分类器进行测试,从中挑选置信度较高的语义类别作为图像的语义标注。但是如果语义类别数目巨大,则对图像进行语义标注时的计算量也会非常巨大,从而实现由的 ...
【技术保护点】
1.一种基于数据平滑的图像语义自动标注方法,其特征在于,包括:S1:输入初始图像集,将所述图像集进行预处理形成训练图像集;S2:根据训练图像集提取视觉词元信息;S3:根据训练图像集提取关键字信息;S4:根据视觉词元信息生成初始标注矩阵;S5:根据关键字信息生成词间相关性矩阵;S6:利用词间相关性矩阵对出示标注矩阵进行调整,得到标注矩阵;S7:将标注矩阵进行排序,从排序后的标注矩阵中选取预设列数的元素形成最终标注矩阵。
【技术特征摘要】
1.一种基于数据平滑的图像语义自动标注方法,其特征在于,包括:S1:输入初始图像集,将所述图像集进行预处理形成训练图像集;S2:根据训练图像集提取视觉词元信息;S3:根据训练图像集提取关键字信息;S4:根据视觉词元信息生成初始标注矩阵;S5:根据关键字信息生成词间相关性矩阵;S6:利用词间相关性矩阵对出示标注矩阵进行调整,得到标注矩阵;S7:将标注矩阵进行排序,从排序后的标注矩阵中选取预设列数的元素形成最终标注矩阵。2.如权利要求1所述的方法,其特征在于,所述将图像集进行预处理形成训练图像集中的预处理包括:将图像尺寸大小归一化处理、图像恢复处理。3.如权利要求2所述的方法,其特征在于,所述根据训练图像集形成视觉词元步骤包括:将训练图像集进行分割、再根据训练图像集的颜色和纹理提取视觉特征,将视觉特征量化形成视觉词元。4.如权利要求3所述的方法,其特征在于,所述根据关键字和视觉词元信息生成初始标注矩阵的步骤包括:利用Add-one平滑技术将提取的关键字和视觉词元信息进行数据平滑处...
【专利技术属性】
技术研发人员:简宋全,李青海,侯大勇,邹立斌,
申请(专利权)人:广东精点数据科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。