数字图像的语义标签的获取方法及装置制造方法及图纸

技术编号:13293722 阅读:111 留言:0更新日期:2016-07-09 11:36
本申请公开了数字图像的语义标签的获取方法及装置。所述方法的一具体实施方式包括:获取数字图像;查找与所述数字图像对应的语义标签模型,所述语义标签模型用于表征数字图像与语义标签的对应关系,所述语义标签用于对数字图像进行文字说明;将所述数字图像导入所述语义标签模型,得到对应所述数字图像的全图识别信息和局部识别信息,将所述全图识别信息和局部识别信息组合成语义标签。该实施方式首先获取数字图像;然后查找与所述数字图像对应的语义标签模型,通过语义标签模型获取语义标签,提高了获取数字图像对应的语义标签的准确度。

【技术实现步骤摘要】

本申请涉及信息处理
,具体涉及图像识别
,尤其涉及数字图像的语义标签的获取方法及装置
技术介绍
图像识别技术已广泛应用在日常生活中,例如,通过图像识别技术识别过往车辆的车牌信息。图像识别技术通常需要将非数字图像转换为数字图像,然后再对数字图像进行识别,或直接获取数字图像,并对数字图像进行识别。但现有的图像识别技术对图像识别得到的信息不够,不能给出更多的图像信息。还以上述通过图像识别技术识别车牌信息为例,现有的图像识别技术能够识别到的是车牌的图像,而车牌图像的具体信息(如车牌包含的数字、字符)则需要人工进行识别。图像的细粒度识别方法是指建立图像与语义标签的关联关系,并且利用关联关系,通过语义标签对图像进行描述的方法。其中,细粒度是指在识别出数字图像内容类型的前提下,进一步识别出数字图像内容的下级分类;语义标签用于对数字图像进行文字说明。例如,对于一张包含小狗的图像,现有的图像识别技术只能识别到小狗的图像,而无法提供小狗更多的信息;图像的细粒度识别方法则不仅能识别出小狗的图像,还能识别出小狗的具体信息,如种类、毛色(即,细粒度信息),并通过语义标签的形式输出小狗的具体信息。需要说明的是,细粒度是个相对概念,并且,对于不同的数字图像或图像内容下,细粒度的含义可以不同。现有的图像的细粒度识别方法对图像进行细粒度识别的过程为:首先抽取整个图像的图像特征,或在人工事先选择好的图像区域抽取图像的局部特征;然后为图像特征或局部特征设置语义标签。由于是基于抽取的图像特征或人工选择图像区域后得到的局部特征获得的语义标签,因此,无法给出准确的语义标签,且难以进行大规模的应用。
技术实现思路
本申请提供了数字图像的语义标签的获取方法及装置,以解决
技术介绍
中提到的问题。一方面,本申请提供了一种数字图像的语义标签的获取方法,所述方法包括:获取数字图像;查找与所述数字图像对应的语义标签模型,所述语义标签模型用于表征数字图像与语义标签的对应关系,所述语义标签用于对数字图像进行文字说明;将所述数字图像导入所述语义标签模型,得到对应所述数字图像的全图识别信息和局部识别信息,将所述全图识别信息和局部识别信息组合成语义标签,所述全图识别信息是对所述数字图像的概括性描述,所述局部识别信息是对所述数字图像的具体描述。第二方面,本申请提供了一种数字图像的语义标签的获取装置,所述装置包括:数字图像获取单元,用于获取数字图像;语义标签模型查询单元,用于查找与所述数字图像对应的语义标签模型,所述语义标签模型用于表征数字图像与语义标签的对应关系,所述语义标签用于对数字图像进行文字说明;语义标签获取单元,用于将所述数字图像导入所述语义标签模型,得到对应所述数字图像的全图识别信息和局部识别信息,将所述全图识别信息和局部识别信息组合成语义标签,所述全图识别信息是对所述数字图像的概括性描述,所述局部识别信息是对所述数字图像的具体描述。第三方面,本申请提供了一种数字图像的语义标签的获取设备,所述设备包括上述第二方面的数字图像的语义标签的获取装置。本申请提供的数字图像的语义标签的获取方法及装置,首先获取数字图像;然后查找与所述数字图像对应的语义标签模型,通过语义标签模型获取语义标签,提高了获取数字图像对应的语义标签的准确度。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是根据本申请的可以应用于其中的示例性系统架构图;图2是根据本申请的数字图像的语义标签的获取方法的一个实施例流程图;图3是根据本申请的数字图像的语义标签的获取方法的应用场景的一个示意图;图4是根据本申请的数字图像的语义标签的获取装置的一个实施例结构示意图;图5是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的数字图像的语义标签的获取方法或数字图像的语义标签的获取装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送数字图像等。终端设备101、102、103上可以安装有各种图片应用和网络应用,例如图片浏览器和网页浏览器等。终端设备101、102、103可以是具有显示屏并且图片浏览器和网页浏览器的各种电子设备,包括但不限于智能手机、平板电脑和笔记本等。服务器105可以是对图片进行分析,并对图片进行文字描述的服务器,例如对终端设备101、102、103发来的数字图像配置语义标签的服务器。服务器105可以对接收到的数字图像进行分析处理,并对数字图像配置对应的语义标签。需要说明的是,本申请实施例所提供的数字图像的语义标签的获取方法一般由服务器105执行,相应地,数字图像的语义标签的获取装置一般设置于服务器105中。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。继续参考图2,图2示出了数字图像的语义标签的获取方法的一个实施例的流程图200。如图2所示,本实施例的数字图像的语义标签的获取方法包括以下步骤:步骤201,获取数字图像。在本实施例中,数字图像的语义标签的获取方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端设备(例如图1所示的终端设备101、102、103)进行数据传递,以获取语义标签。终端设备101、102、103上的图片应用和网络应用将图片发送给服务器105。由于服务器105只能对数字图像配置语义标签,因此本文档来自技高网
...
数字图像的语义标签的获取方法及装置

【技术保护点】
一种数字图像的语义标签的获取方法,其特征在于,所述方法包括:获取数字图像;查找与所述数字图像对应的语义标签模型,所述语义标签模型用于表征数字图像与语义标签的对应关系,所述语义标签用于对数字图像进行文字说明;将所述数字图像导入所述语义标签模型,得到对应所述数字图像的全图识别信息和局部识别信息,将所述全图识别信息和局部识别信息组合成语义标签,所述全图识别信息是对所述数字图像的概括性描述,所述局部识别信息是对所述数字图像的具体描述。

【技术特征摘要】
1.一种数字图像的语义标签的获取方法,其特征在于,所述方法
包括:
获取数字图像;
查找与所述数字图像对应的语义标签模型,所述语义标签模型用
于表征数字图像与语义标签的对应关系,所述语义标签用于对数字图
像进行文字说明;
将所述数字图像导入所述语义标签模型,得到对应所述数字图像
的全图识别信息和局部识别信息,将所述全图识别信息和局部识别信
息组合成语义标签,所述全图识别信息是对所述数字图像的概括性描
述,所述局部识别信息是对所述数字图像的具体描述。
2.根据权利要求1所述的方法,其特征在于,所述查找与所述数
字图像对应的语义标签模型包括:
对所述数字图像进行类型分析,确定所述数字图像的类型信息,
所述类型信息包括数字、文字、人物、动物、食物中的至少一项;
查找与所述类型信息对应的语义标签模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
构建语义标签模型的步骤,包括:
分别从数字图像集合和语义标签集合中提取数字图像和语义标
签;
将所述数字图像按类型信息分为至少一个类型数字图像集合,所
述类型信息包括数字、文字、人物、动物、食物中的至少一项;
将所述语义标签按所述类型信息分为至少一个类型语义标签集
合;
利用机器学习方法,基于所述类型数字图像和与所述类型数字图
像相关联的类型语义标签,训练得到对应所述类型信息的至少一个语
义标签模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述数字图
像按类型信息分为至少一个类型数字图像集合还包括:
对所述数字图像进行识别,得到类型信息的步骤。
5.根据权利要求3所述的方法,其特征在于,所述利用机器学习
方法,基于所述类型数字图像和与所述类型数字图像相关联的类型语
义标签,训练得到对应所述类型信息的至少一个语义标签模型包括:
对所述类型数字图像进行细粒度识别,得到对应所述类型数字图
像的细粒度信息,所述细粒度为所述类型信息的下级分类;
查找与所述细粒度信息对应的类型语义标签;
利用机器学习方法,基于所述细粒度信息和与所述细粒度信息对
应的类型语义标签,训练得到对应所述类型信息的语义标签模型。
6.根据权利要求5所述的方法,其特征在于,所述对所述类型数
字图像进行细粒度识别,得到对应所述类型数字图像的细粒度信息还
包括:
对所述类型数字图像进行全图识别得到全图识别信息;
从所述类型数字图像中确定注意力区域,所述注意力区域为对所
述类型数字图像进行细粒度识别的区域;
通过细粒度对所述注意力区域内的图像进行识别得到局部识别信
息;
将所述全图识别信息和局部识别信息组合成细粒度信息。
7.一种数字图像的语义标签的获取装置,其特征在于,所述装置
包括:
数字图像获取单元,用于获取数字图像;
语义标签模型查询单元,用于查找与所述数字图像对应的语义标
签模型,所述语义标签模型用于表征数字图像与语义标...

【专利技术属性】
技术研发人员:刘霄夏添王江
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1