为图像添加标签的方法、系统和装置制造方法及图纸

技术编号：12017575 阅读：148 留言：0更新日期：2015-09-09 13:47

本发明专利技术公开了为图像添加标签的方法、系统和装置：在进行静态图像展示或进行视频文件播放的过程中，当确定当前图像中出现预定类型的物品时，从当前图像中切割出包含所述预定类型的物品的子图像，所述子图像的数量为M，M为正整数；并针对每幅子图像，分别进行以下处理：生成该子图像的指纹；分别将该子图像的指纹与指纹库中预先生成并保存的、属于所述预定类型的各不同物品图像的指纹进行匹配；从匹配成功的指纹中选定一个指纹，并将所述指纹库中所保存的、与选定的指纹对应的物品的预定信息作为标签，展示到当前图像中的预定位置。应用本发明专利技术所述方案，能够节省人力成本，且具有广泛适用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理技术，特别涉及为图像添加标签的方法、系统和装置。
技术介绍
当用户通过互联网等观看某一视频文件时，可能会希望了解视频中所出现的某种类型的物品的一些基本信息。为了满足用户的上述需求，现有技术中，通常采用人工在视频进度中打上物品标签的方式，即在视频文件中出现所述类型的物品的不同时间点，分别通过人工的方式在图像中添加标签，即展示介绍物品的一些基本信息。但是，互联网中的视频文件数量巨大，如果都采用上述人工添加标签的方式，几乎是不可能完成的任务，因此只能选择性地对部分视频文件进行上述处理。可见，现有方式不但会耗费大量的人力成本，而且不具有广泛适用性。
技术实现思路
有鉴于此，本专利技术提供了为图像添加标签的方法、系统和装置，能够节省人力成本，且具有广泛适用性。为了达到上述目的，本专利技术的技术方案是这样实现的：一种为图像添加标签的方法，包括：在进行静态图像展示或进行视频文件播放的过程中，当确定当前图像中出现预定类型的物品...

【技术保护点】
一种为图像添加标签的方法，其特征在于，包括：在进行静态图像展示或进行视频文件播放的过程中，当确定当前图像中出现预定类型的物品时，从当前图像中切割出包含所述预定类型的物品的子图像，所述子图像的数量为M，M为正整数；针对每幅子图像，分别进行以下处理：生成该子图像的指纹；分别将该子图像的指纹与指纹库中预先生成并保存的、属于所述预定类型的各不同物品图像的指纹进行匹配；从匹配成功的指纹中选定一个指纹，将所述指纹库中所保存的、与选定的指纹对应的物品的预定信息作为标签，展示到当前图像中的预定位置。

【技术特征摘要】
1.一种为图像添加标签的方法，其特征在于，包括：
在进行静态图像展示或进行视频文件播放的过程中，当确定当前图像中出现预定
类型的物品时，从当前图像中切割出包含所述预定类型的物品的子图像，所述子图像
的数量为M，M为正整数；
针对每幅子图像，分别进行以下处理：
生成该子图像的指纹；分别将该子图像的指纹与指纹库中预先生成并保存的、属
于所述预定类型的各不同物品图像的指纹进行匹配；
从匹配成功的指纹中选定一个指纹，将所述指纹库中所保存的、与选定的指纹对
应的物品的预定信息作为标签，展示到当前图像中的预定位置。
2.根据权利要求1所述的方法，其特征在于，
每幅图像的指纹包括：第一指纹和第二指纹；
所述分别将该子图像的指纹与指纹库中预先生成并保存的、属于所述预定类型的
各不同物品图像的指纹进行匹配包括：
分别计算所述指纹库中所保存的各第一指纹与该子图像的第一指纹的相似度，并
确定相似度大于预定第一阈值的第一指纹数是否大于预定第二阈值；
如果是，则将相似度大于所述第一阈值的第一指纹作为匹配成功的指纹；
如果否，则分别计算所述指纹库中所保存的各第二指纹与该子图像的第二指纹的
相似度，并将相似度大于所述第一阈值的第一指纹以及相似度大于所述第一阈值的第
二指纹作为匹配成功的指纹。
3.根据权利要求2所述的方法，其特征在于，
所述第一指纹的生成方式包括：针对每幅图像，分别生成该图像的颜色分布直方
图，并将生成的颜色分布直方图对应的向量作为该图像的第一指纹；
所述第二指纹的生成方式包括：针对每幅图像，分别生成该图像的感知哈希值，
并将生成的感知哈希值作为该图像的第二指纹。
4.根据权利要求3所述的方法，其特征在于，
所述生成该图像的颜色分布直方图包括：
将红、绿、蓝三原色的取值0～255分别划分为四个区间，其中，第一区间的取值
为0～63，第二区间的取值为64～127，第三区间的取值为128～191，第四区间的取
值为192～255；按照红、绿、蓝三原色所属区间的不同，确定出64种不同的颜色组
合方式；
针对该图像中的每个像素点，分别根据该像素点的红、绿、蓝三原色的取值所属
的区间，确定出该像素点对应的颜色组合方式；
分别统计每种颜色组合方式对应的像素点数，并根据统计结果生成该图像的颜色
分布直方图。
5.根据权利要求3所述的方法，其特征在于，
所述生成该图像的感知哈希值包括：
将该图像缩小为8×8大小，并将缩小后的图像转换为64级的灰度图像；
计算转换后的灰度图像中的各像素点的灰度平均值；
分别将转换后的灰度图像中的各像素点的灰度值与所述灰度平均值进行比较，如
果该像素点的灰度值大于或等于所述灰度平均值，则将该像素点的取值设置为1，否
则，设置为0；
将取值为1或0的各像素点的取值按照预定顺序进行组合，得到一个长度为64
位的整数，作为该图像的感知哈希值。
6.根据权利要求1所述的方法，其特征在于，
所述从匹配成功的指纹中选定一个指纹包括以下之一：
将匹配成功的指纹中与该子图像的指纹相似度最高的指纹作为选定的指纹；
按照预定规则对匹配成功的指纹进行筛选，将筛选后剩余的指纹中与该子图像的
指纹相似度最高的指纹作为选定的指纹。
7.根据权利要求6所述的方法，其特征在于，
所述按照预定规则对匹配成功的指纹进行筛选包括：
确定该子图像中的物品适合的性别；
针对每个匹配成功的指纹，分别确定该指纹对应的物品适合的性别是否与该子图
像中的物品适合的性别相同，如果是，则保留该指纹，否则，丢弃该指纹。
8.根据权利要求7所述的方法，其特征在于，
当进行视频文件播放时，所述按照预定规则对匹配成功的指纹进行筛选进一步包
括：
对视频文件的名称进行关键词提取；
针对每个匹配成功的指纹，分别确定该指纹对应的物品是否与所述关键词的描述
相符合，如果是，则保留该指纹，否则，丢弃该指纹。
9.根据权利要求1所述的方法，其特征在于，
所述当确定当前图像中出现预定类型的物品时，从当前图...

【专利技术属性】
技术研发人员：周莜，戴佳瑶，瞿佳，谢奕，
申请(专利权)人：腾讯科技北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人