图片的标注方法、装置及电子设备制造方法及图纸

技术编号:16216994 阅读:48 留言:0更新日期:2017-09-15 23:14
本发明专利技术实施例提供的一种图片的标注方法、装置及电子设备,涉及图片标注技术领域。所述方法包括对获取到的待标注图片进行特征提取,获得所述待标注图片对应的特征向量;再基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型,获得所述待标注图片的标注结果,以此实现采用多视图半监督图片标注模型对图片进行标注,具备良好的噪声认知能力,效率高、稳定性强。

Method, device and electronic device for marking pictures

The invention provides an annotation method, a device and an electronic device provided by an embodiment of the invention, relating to the technical field of picture annotation. The method includes access to the annotation of image feature extraction, the feature vectors to be annotated pictures; then based on the feature vector of the image corresponding to the annotation and presupposition of multi view semi supervised image annotation model, the annotation results obtain the annotation of the picture, in order to realize the multi view semi supervise the annotation model to tag the picture picture, with good noise cognitive ability, high efficiency, strong stability.

【技术实现步骤摘要】
图片的标注方法、装置及电子设备
本专利技术涉及图片标注
,具体而言,涉及一种图片的标注方法、装置及电子设备。
技术介绍
在多媒体大数据时代,随着越来越多的图片的出现,目前大多数基于内容的图片检索方法并不能得到良好的体验,而自动图片标注(AutomaticImageAnnotation)由于可很好的促进图片语义检索及其它相关图片管理任务已经成为多媒体领域最重要的研究方向之一。自动图片标注可通过结合标签和图片,把基于内容的图片检索转换为基于文本的图片检索。当图片特征和相关的语义标签得到以后,可应用多种机器学习算法来适应标签。现如今,由于智能手机和无线通信网络的发展,图片的获取越来越方便,能够随时随地分享到互联网上去,这带来多媒体应用的迫切需求,包括语义索引、搜索、检索以及其他的图片管理任务。尽管多媒体内容分析方面做了很多工作,主要的搜索引擎产品还是基于文本索引技术。因而在图片大数据的背景下,图片标注算法的效率、稳定性依然不足。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种图片的标注方法、装置及电子设备,以改善上述问题。为了实现上述目的,本专利技术采取的技术方案如下:第一方面,本专利技术实施例提供了一种图片的标注方法,所述方法包括对获取到的待标注图片进行特征提取,获得所述待标注图片对应的特征向量;基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型,获得所述待标注图片的标注结果。第二方面,本专利技术实施例提供了一种图片的标注装置,所述装置包括特征提取单元和标注单元。特征提取单元,用于对获取到的待标注图片进行特征提取,获得所述待标注图片对应的特征向量。标注单元,用于基于所述特征提取单元获得的所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型,获得所述待标注图片的标注结果。第三方面,本专利技术实施例提供了一种电子设备,所述电子设备包括处理器和存储器。所述处理器和所述存储器通过总线电连接。所述存储器用于储存程序。所述处理器用于通过所述总线调用存储在所述存储器中的程序,执行:对获取到的待标注图片进行特征提取,获得所述待标注图片对应的特征向量;基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型,获得所述待标注图片的标注结果。本专利技术实施例提供了一种图片的标注方法、装置及电子设备,对获取到的待标注图片进行特征提取,获得所述待标注图片对应的特征向量;再基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型,获得所述待标注图片的标注结果,以此实现采用多视图半监督图片标注模型对图片进行标注,具备良好的噪声认知能力,效率高、稳定性强。本专利技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术实施例了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术实施例提供的一种电子设备的结构框图;图2为本专利技术第一实施例提供的图片的标注方法的流程图;图3为本专利技术第一实施例提供的图片的标注方法中获取预设的多视图半监督图片标注模型的流程图;图4为本专利技术第一实施例提供的图片的标注方法中以NUS-WIDE为训练数据,提取LLC特征、FK特征与已有算法的效果对比示意图;图5为本专利技术第一实施例提供的图片的标注方法中以NUS-WIDE为训练数据,提取FC6、FC7特征与已有算法的效果对比示意图;图6为本专利技术第一实施例提供的图片的标注方法中以MIRFLICKR-25000为训练数据,提取LLC特征、FK特征与已有算法的效果对比示意图;图7为本专利技术第一实施例提供的图片的标注方法中以MIRFLICKR-25000为训练数据,提取FC6、FC7特征与已有算法的效果对比示意图;图8为本专利技术第一实施例提供的图片的标注方法中以IAPRTC-12为训练数据,提取LLC特征、FK特征与已有算法的效果对比示意图;图9为本专利技术第一实施例提供的图片的标注方法中以IAPRTC-12为训练数据,提取FC6、FC7特征与已有算法的效果对比示意图;图10为本专利技术第二实施例提供的图片的标注装置的结构框图。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。请参阅图1,图1示出了本专利技术实施例提供的一种电子设备100的结构框图。所述电子设备100可以作为用户终端,也可以作为服务器。用户终端可以为:PC(personalcomputer)电脑、平板电脑、手机、电子阅读器、笔记本电脑、智能电视、机顶盒、车载终端等终端设备。如图1所示,电子设备100可以包括存储器110、存储控制器111、处理器112、外设接口113、输入输出单元115、音频单元116、显示单元117。所述存储器110、存储控制器111、处理器112、外设接口113、输入输出单元115、音频单元116、显示单元117各元件之间直接或间接地电连接,以实现数据的传输或交互。例如,这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。图片的标注方法分别包括至少一个可以以软件或固件(firmware)的形式存储于存储器110中的软件功能模块,例如所述图片的标注装置包括的软件功能模块或计算机程序。存储器110可以存储各种软件程序以及模块,如本申请实施例提供的图片的标注方法及装置对应的程序指令/模块。处理器112通过运行存储在存储器110中的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的图片的标注方法。存储器110可以包括但不限于随机存取存储器(RandomAccessMemory,RAM),只读存储器(ReadOnlyMemory,ROM),可编程只读存储器(ProgrammableRead-OnlyMemory,PROM),可擦除只读存储器(ErasableProgrammableRead-OnlyMemory,EPROM),电可擦除只读存储器(ElectricErasableProgrammableRead-OnlyMemory,EEPROM)等。处理器112可以是一种集成电路芯片,具有信号处理能力。上述处理器可以是通用处理器,包括中央处理器(Centra本文档来自技高网...
图片的标注方法、装置及电子设备

【技术保护点】
一种图片的标注方法,其特征在于,所述方法包括:对获取到的待标注图片进行特征提取,获得所述待标注图片对应的特征向量;基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型,获得所述待标注图片的标注结果。

【技术特征摘要】
1.一种图片的标注方法,其特征在于,所述方法包括:对获取到的待标注图片进行特征提取,获得所述待标注图片对应的特征向量;基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型,获得所述待标注图片的标注结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型,获得所述待标注图片的标注结果,包括:基于获得所述待标注图片的预测标签值,以此获得所述待标注图片的标注结果;其中,Xt,t=1,2,…,m为所述待标注图片对应的特征向量,Wt,t=1,2,…,m为预设的映射矩阵,bt,t=1,2,…,m为预设的偏差项,为所述待标注图片的预测标签值。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:对获取到的n个图片进行特征提取,获得所述n个图片对应的多视图特征及标签矩阵;基于所述n个图片对应的多视图特征以及预设的相似度计算规则,获得所述n个图片对应的相似度矩阵;获取所述n个图片对应的相似度矩阵中的所有对角元值,获得对角矩阵;将所述对角矩阵减去所述n个图片对应的相似度矩阵,获得所述n个图片对应的拉普拉斯矩阵;将所述n个图片对应的标签矩阵、拉普拉斯矩阵带入预设的目标函数进行迭代计算,获得所述预设的映射矩阵和所述预设的偏差项。4.根据权利要求3所述的方法,其特征在于,所述基于所述n个图片对应的多视图特征以及预设的相似度计算规则,获得所述n个图片对应的相似度矩阵,包括:基于获得所述n个图片对应的相似度矩阵,S=[Sij],1≤i,j≤n为所述n个图片对应的相似度矩阵,xi,xj(1≤i,j≤n)为所述n个图片中第i、j个图片各自对应的多视图特征,Nk(xi)为xi的最近邻集合k,Nq(xj)为xj的最近邻集合q。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述待标注图片对应的特征向量通过主成分分析法进行降维,获得降维后的特征向量。6.一种图片的标注装置,其特征在于,所述装置包括:特征提取单元,用于对获取到的待标注图片进行特征提取,获得所述待标注图片对应的特征向量...

【专利技术属性】
技术研发人员:杨阳胡孟秋刘陆琛申恒涛
申请(专利权)人:成都澳海川科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1