一种图像识别方法和装置制造方法及图纸

技术编号:28625008 阅读:17 留言:0更新日期:2021-05-28 16:21
本发明专利技术公开了图像识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:接收未标记的图像数据集和已标记的图像数据集;利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络;将未标记的图像数据集,通过训练好的第一多标记分类网络,获得每个图像的标记结果及对应的置信度值;根据所述标记结果及对应的置信度值,更新预设的第二多标记分类网络,进而通过更新后的第二多标记分类网络对图像进行标记。该实施方式能够解决现有技术中无法快速有效处理图像的问题。

【技术实现步骤摘要】
一种图像识别方法和装置
本专利技术涉及计算机
,尤其涉及一种图像识别方法和装置。
技术介绍
随着科学技术的不断发展,多媒体设备也越来越多的出现在我们生活中,随着带给我们的体验就是多媒体的形式也越来越丰富,多样的图像表现形式给我们的生活增添了更多的色彩和乐趣。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:然而,随之而来的是,图像等多媒体数据呈现爆炸式增长,如何有效管理海量图像数据已成为一种挑战,同时快速有效处理图像的分类也是亟待解决的问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种图像识别方法和装置,能够解决现有技术中无法快速有效处理图像的问题。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种图像识别方法,包括接收未标记的图像数据集和已标记的图像数据集;利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络;将未标记的图像数据集,通过训练好的第一多标记分类网络,获得每个图像的标记结果及对应的置信度值;根据所述标记结果及对应的置信度值,更新预设的第二多标记分类网络,进而通过更新后的第二多标记分类网络对图像进行标记。可选地,利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络,包括:对已标记的图像进行标记所在区域的切分,得到候选区域集合;将所述候选区域输入至预设的第一多标记分类网络中进行训练,以得到待训练好的第一多标记分类网络;基于已标记的图像数据集,利用加权的交叉熵损失函数训练第一多标记分类网络,以得到训练好的第一多标记分类网络。可选地,获得每个图像的标记结果及对应的置信度值之后,包括:对标记结果及对应的置信度值,通过蒙特卡罗方法计算得到标记结果的平均分数向量;通过计算平均分数向量的熵,得到每个标记的整体置信度值。可选地,根据所述标记结果及对应的置信度值,更新预设的第二多标记分类网络,包括:将整体置信度值转换为标准化后验置信度,进而得到未标记的图像的损失值;计算已标记的图像损失值与未标记的图像损失值之和,以根据标记结果和损失值之和更新预设的第二多标记分类网络;其中,已标记的图像损失值是根据已标记的图像数据集计算的分类交叉熵可选地,还包括:第一多标记分类网络是以AlexNet为基础的8层网络模型,以及第二多标记分类网络是以AlexNet为基础的5层卷积加3层全连接模型。另外,根据本专利技术实施例的一个方面,提供了一种图像识别装置,包括接收模块,用于接收未标记的图像数据集和已标记的图像数据集;识别模块,用于利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络;将未标记的图像数据集,通过训练好的第一多标记分类网络,获得每个图像的标记结果及对应的置信度值;根据所述标记结果及对应的置信度值,更新预设的第二多标记分类网络,进而通过更新后的第二多标记分类网络对图像进行标记。可选地,所述识别模块利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络,包括:对已标记的图像进行标记所在区域的切分,得到候选区域集合;将所述候选区域输入至预设的第一多标记分类网络中进行训练,以得到待训练好的第一多标记分类网络;基于已标记的图像数据集,利用加权的交叉熵损失函数训练第一多标记分类网络,以得到训练好的第一多标记分类网络。可选地,所述识别模块获得每个图像的标记结果及对应的置信度值之后,包括:对标记结果及对应的置信度值,通过蒙特卡罗方法计算得到标记结果的平均分数向量;通过计算平均分数向量的熵,得到每个标记的整体置信度值。根据本专利技术实施例的另一个方面,还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一图像识别实施例所述的方法。根据本专利技术实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一基于图像识别实施例所述的方法。上述专利技术中的一个实施例具有如下优点或有益效果:本专利技术通过接收未标记的图像数据集和已标记的图像数据集;利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络;将未标记的图像数据集,通过训练好的第一多标记分类网络,获得每个图像的标记结果及对应的置信度值;根据所述标记结果及对应的置信度值,更新预设的第二多标记分类网络,进而通过更新后的第二多标记分类网络对图像进行标记。从而,本专利技术所述的图像识别方法能够快速、有效地识别图像,同时能够在有限标记数据的范围内,提升大量的实际可用的未标记数据,以大幅度改进图像识别的性能。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术第一实施例的图像识别方法的主要流程的示意图;图2是根据本专利技术第二实施例的图像识别方法的主要流程的示意图;图3是根据本专利技术实施例的图像识别装置的主要模块的示意图;图4是本专利技术实施例可以应用于其中的示例性系统架构图;图5是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本专利技术实施例的图像识别方法的主要流程的示意图,所述图像识别方法可以包括:步骤S101,接收未标记的图像数据集和已标记的图像数据集。步骤S102,利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络。较佳地,在训练第一多标记分类网络时,首先对已标记的图像进行标记所在区域的切分,得到候选区域集合。然后,将所述候选区域输入至预设的第一多标记分类网络中进行训练,以得到待训练好的第一多标记分类网络。最后,基于已标记的图像数据集,利用加权的交叉熵损失函数训练第一多标记分类网络,以得到训练好的第一多标记分类网络。步骤S103,将未标记的图像数据集,通过训练好的第一多标记分类网络,获得每个图像的标记结果及对应的置信度值。较佳地,获得每个图像的标记结果及对应的置信度值之后,可以对标记结果及对应的置信度值,通过蒙特卡罗方法计算得到标记结果的平均分数向量。然后,通过计算平均分数向量的熵,得到每个标记的整体置信度值。步骤S104,根据所述标记结果及对应本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,包括:/n接收未标记的图像数据集和已标记的图像数据集;/n利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络;/n将未标记的图像数据集,通过训练好的第一多标记分类网络,获得每个图像的标记结果及对应的置信度值;/n根据所述标记结果及对应的置信度值,更新预设的第二多标记分类网络,进而通过更新后的第二多标记分类网络对图像进行标记。/n

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:
接收未标记的图像数据集和已标记的图像数据集;
利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络;
将未标记的图像数据集,通过训练好的第一多标记分类网络,获得每个图像的标记结果及对应的置信度值;
根据所述标记结果及对应的置信度值,更新预设的第二多标记分类网络,进而通过更新后的第二多标记分类网络对图像进行标记。


2.根据权利要求1所述的方法,其特征在于,利用已标记的图像数据集,对预设的第一多标记分类网络进行训练,以得到训练好的第一多标记分类网络,包括:
对已标记的图像进行标记所在区域的切分,得到候选区域集合;
将所述候选区域输入至预设的第一多标记分类网络中进行训练,以得到待训练好的第一多标记分类网络;
基于已标记的图像数据集,利用加权的交叉熵损失函数训练第一多标记分类网络,以得到训练好的第一多标记分类网络。


3.根据权利要求1所述的方法,其特征在于,获得每个图像的标记结果及对应的置信度值之后,包括:
对标记结果及对应的置信度值,通过蒙特卡罗方法计算得到标记结果的平均分数向量;
通过计算平均分数向量的熵,得到每个标记的整体置信度值。


4.根据权利要求3所述的方法,其特征在于,根据所述标记结果及对应的置信度值,更新预设的第二多标记分类网络,包括:
将整体置信度值转换为标准化后验置信度,进而得到未标记的图像的损失值;
计算已标记的图像损失值与未标记的图像损失值之和,以根据标记结果和损失值之和更新预设的第二多标记分类网络;其中,已标记的图像损失值是根据已标记的图像数据集计算的分类交叉熵。


5.根据权利要求1-4任一所述的方法,其特征在于,还包括:
第一多标记分类网络是以AlexNet为基础的8层网...

【专利技术属性】
技术研发人员:刘义明周默
申请(专利权)人:北京沃东天骏信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1