【技术实现步骤摘要】
本申请涉及信息处理
,具体涉及图像识别
,尤其涉及数字图像的语义标签的获取方法及装置。
技术介绍
图像识别技术已广泛应用在日常生活中,例如,通过图像识别技术识别过往车辆的车牌信息。图像识别技术通常需要将非数字图像转换为数字图像,然后再对数字图像进行识别,或直接获取数字图像,并对数字图像进行识别。但现有的图像识别技术对图像识别得到的信息不够,不能给出更多的图像信息。还以上述通过图像识别技术识别车牌信息为例,现有的图像识别技术能够识别到的是车牌的图像,而车牌图像的具体信息(如车牌包含的数字、字符)则需要人工进行识别。图像的细粒度识别方法是指建立图像与语义标签的关联关系,并且利用关联关系,通过语义标签对图像进行描述的方法。其中,细粒度是指在识别出数字图像内容类型的前提下,进一步识别出数字图像内容的下级分类;语义标签用于对数字图像进行文字说明。例如,对于一张包含小狗的图像,现有的图像识别技术只能识别到小狗的图像,而无法提供小狗更多的信息;图像的细粒度识别方法则不仅能识别出小狗的图像,还能识别出小狗的具体信息,如种类、毛色(即,细粒度信息),并通过语义标签的形式输出小狗的具体信息。需要说明的是,细粒度是个相对概念,并且,对于不同的数字图像或图像内容下,细粒度的含义可以不同。现有的图像的细粒度识别方法对图像进行细粒度识别的过程为:首先抽取整个图像的图像特征,或在人工事先选择 ...
【技术保护点】
一种数字图像的语义标签的获取方法,其特征在于,所述方法包括:获取数字图像;查找与所述数字图像对应的语义标签模型,所述语义标签模型用于表征数字图像与语义标签的对应关系,所述语义标签用于对数字图像进行文字说明;将所述数字图像导入所述语义标签模型,得到对应所述数字图像的全图识别信息和局部识别信息,将所述全图识别信息和局部识别信息组合成语义标签,所述全图识别信息是对所述数字图像的概括性描述,所述局部识别信息是对所述数字图像的具体描述。
【技术特征摘要】
1.一种数字图像的语义标签的获取方法,其特征在于,所述方法
包括:
获取数字图像;
查找与所述数字图像对应的语义标签模型,所述语义标签模型用
于表征数字图像与语义标签的对应关系,所述语义标签用于对数字图
像进行文字说明;
将所述数字图像导入所述语义标签模型,得到对应所述数字图像
的全图识别信息和局部识别信息,将所述全图识别信息和局部识别信
息组合成语义标签,所述全图识别信息是对所述数字图像的概括性描
述,所述局部识别信息是对所述数字图像的具体描述。
2.根据权利要求1所述的方法,其特征在于,所述查找与所述数
字图像对应的语义标签模型包括:
对所述数字图像进行类型分析,确定所述数字图像的类型信息,
所述类型信息包括数字、文字、人物、动物、食物中的至少一项;
查找与所述类型信息对应的语义标签模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
构建语义标签模型的步骤,包括:
分别从数字图像集合和语义标签集合中提取数字图像和语义标
签;
将所述数字图像按类型信息分为至少一个类型数字图像集合,所
述类型信息包括数字、文字、人物、动物、食物中的至少一项;
将所述语义标签按所述类型信息分为至少一个类型语义标签集
合;
利用机器学习方法,基于所述类型数字图像和与所述类型数字图
像相关联的类型语义标签,训练得到对应所述类型信息的至少一个语
义标签模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述数字图
像按类型信息分为至少一个类型数字图像集合还包括:
对所述数字图像进行识别,得到类型信息的步骤。
5.根据权利要求3所述的方法,其特征在于,所述利用机器学习
方法,基于所述类型数字图像和与所述类型数字图像相关联的类型语
义标签,训练得到对应所述类型信息的至少一个语义标签模型包括:
对所述类型数字图像进行细粒度识别,得到对应所述类型数字图
像的细粒度信息,所述细粒度为所述类型信息的下级分类;
查找与所述细粒度信息对应的类型语义标签;
利用机器学习方法,基于所述细粒度信息和与所述细粒度信息对
应的类型语义标签,训练得到对应所述类型信息的语义标签模型。
6.根据权利要求5所述的方法,其特征在于,所述对所述类型数
字图像进行细粒度识别,得到对应所述类型数字图像的细粒度信息还
包括:
对所述类型数字图像进行全图识别得到全图识别信息;
从所述类型数字图像中确定注意力区域,所述注意力区域为对所
述类型数字图像进行细粒度识别的区域;
通过细粒度对所述注意力区域内的图像进行识别得到局部识别信
息;
将所述全图识别信息和局部识别信息组合成细粒度信息。
7.一种数字图像的语义标签的获取装置,其特征在于,所述装置
包括:
数字图像获取单元,用于获取数字图像;
语义标签模型查询单元,用于查找与所述数字图像对应的语义标
签模型,所述语义标签模型用于表征数字图像与语义标...
【专利技术属性】
技术研发人员:刘霄,夏添,王江,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。