图像编码生成方法及装置制造方法及图纸

技术编号:16838229 阅读:24 留言:0更新日期:2017-12-19 20:26
本发明专利技术实施例提供了一种图像编码生成方法及装置,涉及图像处理领域。所述方法包括将获取到的原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的特征表示;然后基于所述特征表示及预设编码规则,生成所述原始图像数据对应的编码。效率高、实用性强。

Method and device for generating image coding

An embodiment of the invention provides an image coding generation method and device, which relates to the field of image processing. The method includes mapping the original image data to the preset conceptual space, obtaining the corresponding feature expression of the original image data, and then generating the corresponding coding of the original image data based on the feature representation and preset encoding rules. High efficiency and practicability.

【技术实现步骤摘要】
图像编码生成方法及装置
本专利技术涉及图像处理领域,具体而言,涉及一种图像编码生成方法及装置。
技术介绍
现有特征表示不能够很好的分辨出不同概念不同物体之间的关系,而事实上,这是人类对物体识别,解释物体的最重要的方式。人类通过这种理解各个物体,概念之间的联系与区别的方式,视觉系统可以推广到以前没有见过的物体。此外,一些拥有相近的语义含义的物体会比其他物体更多的同时出现在一种场景中。例如,“猫”和“狗”出现同一个场景中比“猫”和“飞机”更多,因为前者具有更密切的语义关系。并且,已经被广泛认识到,较好的视觉表示应该集成低层面的视觉特征,以解决更为详细的感知方面和基于视觉数据的更一般化的概念的高级语义特征。换句话说,在使用当前方法提取的低层面特征和高级语义之间仍然存在语义差距(SemanticGap),效果并不理想,这种语义差距仍然是一个挑战,进而如何应用于图像编码中是当今业界一大难题。
技术实现思路
本专利技术的目的在于提供一种图像编码生成方法及装置,以改善上述问题。为了实现上述目的,本专利技术采取的技术方案如下:第一方面,本专利技术实施例提供了一种图像编码生成方法,所述方法包括:将获取到的原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的特征表示;基于所述特征表示及预设编码规则,生成所述原始图像数据对应的编码。第二方面,本专利技术实施例提供了一种图像编码生成装置,所述装置包括特征表示获得单元和生成单元。特征表示获得单元,用于将获取到的原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的特征表示。生成单元,用于基于所述特征表示及预设编码规则,生成所述原始图像数据对应的编码。本专利技术实施例提供了一种图像编码生成方法及装置,将获取到的原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的特征表示;然后基于所述特征表示及预设编码规则,生成所述原始图像数据对应的编码。效率高、实用性强。本专利技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术实施例了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术实施例提供的电子设备的结构框图;图2为本专利技术实施例提供的图像编码生成方法的流程图;图3为本专利技术实施例提供的AWA数据集上的mAP比较示意图;图4为本专利技术实施例提供的aYahoo数据集上的mAP比较示意图;图5为本专利技术实施例提供的利用语义和不利用语义的特征对应的结果示意图;图6为本专利技术实施例提供的图像编码生成装置的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。图1示出了一种可应用于本专利技术实施例中的电子设备100的结构框图。如图1所示,电子设备100可以包括存储器102、存储控制器104、一个或多个(图1中仅示出一个)处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116和图像编码生成装置。存储器102、存储控制器104、处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116各元件之间直接或间接地电连接,以实现数据的传输或交互。例如,这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。图像编码生成方法分别包括至少一个可以以软件或固件(firmware)的形式存储于存储器102中的软件功能模块,例如所述图像编码生成装置包括的软件功能模块或计算机程序。存储器102可以存储各种软件程序以及模块,如本申请实施例提供的图像编码生成方法及装置对应的程序指令/模块。处理器106通过运行存储在存储器102中的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的图像编码生成方法。存储器102可以包括但不限于随机存取存储器(RandomAccessMemory,RAM),只读存储器(ReadOnlyMemory,ROM),可编程只读存储器(ProgrammableRead-OnlyMemory,PROM),可擦除只读存储器(ErasableProgrammableRead-OnlyMemory,EPROM),电可擦除只读存储器(ElectricErasableProgrammableRead-OnlyMemory,EEPROM)等。处理器106可以是一种集成电路芯片,具有信号处理能力。上述处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。所述外设接口108将各种输入/输入装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108、处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。输入输出模块110用于提供给用户输入数据实现用户与电子设备100的交互。所述输入输出模块110可以是,但不限于,鼠标和键盘等。音频模块112向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。显示模块114在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示模块114可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器106进行计算和处理。射频模块116用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通信网络或者其他设备进行通信。可以理解,图1所示的结构仅为示意,电本文档来自技高网...
图像编码生成方法及装置

【技术保护点】
一种图像编码生成方法,其特征在于,所述方法包括:将获取到的原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的特征表示;基于所述特征表示及预设编码规则,生成所述原始图像数据对应的编码。

【技术特征摘要】
1.一种图像编码生成方法,其特征在于,所述方法包括:将获取到的原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的特征表示;基于所述特征表示及预设编码规则,生成所述原始图像数据对应的编码。2.根据权利要求1所述的方法,其特征在于,将获取到的原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的特征表示之前,所述方法还包括:获取多个样本图像及所述多个样本图像对应的多个类别标签信息;根据逻辑回归方法对所述多个样本图像进行分类,获得多个超平面;基于所述多个超平面及所述多个类别标签信息,获得所述预设概念空间的多个字典基,所述预设概念空间由所述多个样本图像及所述多个类别标签构建而成,每个字典基表征一个概念。3.根据权利要求2所述的方法,其特征在于,将获取到的原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的特征表示,包括:通过聚类方法对所述多个字典基进行分组,获得所述多个字典基之间的多个相关性信息;判断所述多个相关性信息是否有重叠,若否,基于第一预设目标函数,将原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的原始特征;基于所述原始特征及第二预设目标函数,获得所述原始图像数据对应的特征表示,所述特征表示包括所述原始图像数据的概念和属性信息。4.根据权利要求3所述的方法,其特征在于,所述第一预设目标函数为||X-DcS||,基于第一预设目标函数,将原始图像数据映射到预设概念空间中,获得所述原始图像数据对应的原始特征,包括:将原始图像数据X带入||X-DcS||后,计算获得||X-DcS||的函数值最小时对应的原始特征S,X为原始图像数据,为预设概念空间中的所述多个字典基组成的基矩阵,为所述原始特征。5.根据权利要求3所述的方法,其特征在于,所述第二预设目标函数为基于所述原始特征及第二预设目标函数,获得所述原始图像数据对应的特征表示,包括:将所述原始特征S带入后,计算获得所述原始图像数据对应的特征表示...

【专利技术属性】
技术研发人员:杨阳吴海平徐行申恒涛
申请(专利权)人:成都澳海川科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1