用于图像识别的方法和装置制造方法及图纸

技术编号:22565606 阅读:30 留言:0更新日期:2019-11-16 12:14
本公开的实施例公开了用于图像识别的方法和装置。该方法的一具体实施方式包括:获取待识别的物体的图像;将图像输入预先训练的分类模型,得到分类预测结果和物体的特征;基于分类预测结果计算分类预测结果的可信度;若分类预测结果的可信度小于等于第一可信度阈值,则将特征输入预先构建的检索模型,得到检索预测结果;基于检索预测结果计算检索预测结果的可信度;若检索预测结果的可信度大于第二可信度阈值,则输出检索预测结果。该实施方式实现了多种识别预测结果结合,提高了最终预测的准确性。

Methods and devices for image recognition

Embodiments of the present disclosure disclose methods and devices for image recognition. An embodiment of the method includes: acquiring the image of the object to be recognized; inputting the image into the pre trained classification model to obtain the classification prediction result and the characteristics of the object; calculating the credibility of the classification prediction result based on the classification prediction result; inputting the characteristics into the pre constructed retrieval model if the credibility of the classification prediction result is less than or equal to the first credibility threshold, Get the retrieval prediction results; calculate the credibility of the retrieval prediction results based on the retrieval prediction results; if the credibility of the retrieval prediction results is greater than the second credibility threshold, then output the retrieval prediction results. The implementation mode realizes the combination of multiple recognition and prediction results, and improves the accuracy of the final prediction.

【技术实现步骤摘要】
用于图像识别的方法和装置
本公开的实施例涉及计算机
,具体涉及用于图像识别的方法和装置。
技术介绍
图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术可应用于多种物体的识别,例如,人脸、动物、植物。目前估计生存在地球上的植物有50多万种,种类纷繁,样式各异,中国植物志收入的植物品类有3.7万多种,每种植物又包涵根、茎、叶、花、果实、种子6个部分,各个部位受环境,地域,季节气候等影响,表现出不同的形态,使得植物识别成为依赖大量专业性知识人才才能解决的问题。在环境监控,植物物种入侵识别等方面,都需要投入大量人力和财力,且依靠人工识别的方式,实效性无法得到满足。大规模高质量植物物种识别需求应运而生。目前我们主要从科-属-种粒度对植物进行分类识别,为更好的掌握植物种群分布状态,为进出口植物鉴别生物物种入侵,环境监测,地质生态变化等工作带来基础研究的依据。也可以大大减轻识别的时间和减少人力投入。通常采用以下方式进行图像识别:1、经验识别,人工识别:每个物体通过人工识别,大量依赖专业知识和人力,识别效率低,对专业技能要求较高,完全依赖人员的专业素质和经验,扩展性实效性差。2、图像特征识别:生物,特别是植物受到环境气候影响,在生长形态和标志上存在较大的区别,用图像特征并不能完整代表植物的特性,且无法体现植物各个部分的特征关系。(如特征矩,面积比,边缘等),且不同植物的表征特征区域存在不同,各个植物区分复杂度高,种类大幅度增加之后,识别性能也会急剧下降。3、机器学习识别:利用设计特征加分类器的方式,首先人为设计特征的存在先天缺点,对参数和图像质量敏感,其次分类器强依赖于数据标准的精准性,并且参数调整复杂,多分类任务时,对分类器挑战大。
技术实现思路
本公开的实施例提出了用于图像识别的方法和装置。第一方面,本公开的实施例提供了一种用于图像识别的方法,包括:获取待识别的物体的图像;将图像输入预先训练的分类模型,得到分类预测结果和物体的特征;基于分类预测结果计算分类预测结果的可信度;若分类预测结果的可信度小于等于第一可信度阈值,则将特征输入预先构建的检索模型,得到检索预测结果;基于检索预测结果计算检索预测结果的可信度;若检索预测结果的可信度大于第二可信度阈值,则输出检索预测结果。在一些实施例中,该方法还包括:若分类预测结果的可信度大于第一可信度阈值,则输出分类预测结果。在一些实施例中,该方法还包括:若检索预测结果的可信度小于等于第二可信度阈值,基于分类预测结果和检索预测结果计算图像的各种预测结果的可信度;各种预测结果的可信度最高的预定数目个预测结果作为最终预测结果输出。在一些实施例中,获取待识别的物体的图像,包括:将包括待识别的物体和背景的图像输入预先训练的主体检测模型,得到待识别的物体的图像。在一些实施例中,将图像输入预先训练的分类模型,包括:将待识别的物体的图像输入预先训练的二分类模型,判断物体是否为目标类别;若为目标类别,则将图像输入预先训练的用于识别目标类别的图像的分类模型。在一些实施例中,分类模型为Inception-ResNetv2模型,采用类别均匀采样的方式进行样本选择,并加入标签平滑和混合策略,采用cosine学习率衰减策略,训练损失采用交叉熵损失函数。在一些实施例中,检索模型通过如下步骤构建:提取预定图像库中各图像的特征,其中,图像库中各图像与类别相对应;将各图像的特征进行降维处理;对降维后的各图像的特征构建索引,其中,索引包括正排索引和/或倒排索引。在一些实施例中,主体检测模型采用Faster-RCNN。在一些实施例中,二分类模型采用ResNet-34模型。第二方面,本公开的实施例提供了一种用于图像识别的装置,包括:获取单元,被配置成获取待识别的物体的图像;分类单元,被配置成将图像输入预先训练的分类模型,得到分类预测结果和物体的特征;第一计算单元,被配置成基于分类预测结果计算分类预测结果的可信度;检索单元,被配置成若分类预测结果的可信度小于等于第一可信度阈值,则将特征输入预先构建的检索模型,得到检索预测结果;第二计算单元,被配置成基于检索预测结果计算检索预测结果的可信度;输出单元,被配置成若检索预测结果的可信度大于第二可信度阈值,则输出检索预测结果。在一些实施例中,输出单元进一步被配置成:若分类预测结果的可信度大于第一可信度阈值,则输出分类预测结果。在一些实施例中,该装置还包括融合单元,被配置成:若检索预测结果的可信度小于等于第二可信度阈值,基于分类预测结果和检索预测结果计算图像的各种预测结果的可信度;各种预测结果的可信度最高的预定数目个预测结果作为最终预测结果输出。在一些实施例中,获取单元进一步被:将包括待识别的物体和背景的图像输入预先训练的主体检测模型,得到待识别的物体的图像。在一些实施例中,分类单元进一步被配置成:将待识别的物体的图像输入预先训练的二分类模型,判断物体是否为目标类别;若为目标类别,则将图像输入预先训练的用于识别目标类别的图像的分类模型。在一些实施例中,分类模型为Inception-ResNetv2模型,采用类别均匀采样的方式进行样本选择,并加入标签平滑和混合策略,采用cosine学习率衰减策略,训练损失采用交叉熵损失函数。在一些实施例中,该装置还包括构建单元,被配置成:提取预定图像库中各图像的特征,其中,图像库中各图像与类别相对应;将各图像的特征进行降维处理;对降维后的各图像的特征构建索引,其中,索引包括正排索引和/或倒排索引。在一些实施例中,主体检测模型采用Faster-RCNN。在一些实施例中,二分类模型采用ResNet-34模型。第三方面,本公开的实施例提供了一种用于图像识别的电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一的方法。第三方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一的方法。本公开的实施例提供的用于图像识别的方法和装置,无需特殊的采集设备,图像适应性好。多种识别预测结果结合,提高了最终预测的准确性。无需特殊设计特征,用深度网络模型,提高层图像识别特征,分别应用于分类和检索识别。采用检索预测方式,可支持上万类植物识别,准确率高,扩展性强。整个结果对阈值,图像类别鲁棒性强,发生新类别和新增图像时,调整识别效果时间短,时效性强。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:图1是本公开的一个实施例可以应用于其中的示例性系统架构图;图2是根据本公开的用于图像识别的方法的一个实施例的流程图;图3是根据本本文档来自技高网
...

【技术保护点】
1.一种用于图像识别的方法,包括:/n获取待识别的物体的图像;/n将所述图像输入预先训练的分类模型,得到分类预测结果和物体的特征;/n基于所述分类预测结果计算所述分类预测结果的可信度;/n若所述分类预测结果的可信度小于等于第一可信度阈值,则将所述特征输入预先构建的检索模型,得到检索预测结果;/n基于所述检索预测结果计算所述检索预测结果的可信度;/n若所述检索预测结果的可信度大于第二可信度阈值,则输出所述检索预测结果。/n

【技术特征摘要】
1.一种用于图像识别的方法,包括:
获取待识别的物体的图像;
将所述图像输入预先训练的分类模型,得到分类预测结果和物体的特征;
基于所述分类预测结果计算所述分类预测结果的可信度;
若所述分类预测结果的可信度小于等于第一可信度阈值,则将所述特征输入预先构建的检索模型,得到检索预测结果;
基于所述检索预测结果计算所述检索预测结果的可信度;
若所述检索预测结果的可信度大于第二可信度阈值,则输出所述检索预测结果。


2.根据权利要求1所述的方法,其中,所述方法还包括:
若所述分类预测结果的可信度大于所述第一可信度阈值,则输出所述分类预测结果。


3.根据权利要求1所述的方法,其中,所述方法还包括:
若所述检索预测结果的可信度小于等于第二可信度阈值,基于所述分类预测结果和所述检索预测结果计算所述图像的各种预测结果的可信度;
各种预测结果的可信度最高的预定数目个预测结果作为最终预测结果输出。


4.根据权利要求1所述的方法,其中,所述获取待识别的物体的图像,包括:
将包括待识别的物体和背景的图像输入预先训练的主体检测模型,得到待识别的物体的图像。


5.根据权利要求4所述的方法,其中,所述将所述图像输入预先训练的分类模型,包括:
将所述待识别的物体的图像输入预先训练的二分类模型,判断所述物体是否为目标类别;
若为目标类别,则将所述图像输入预先训练的用于识别目标类别的图像的分类模型。


6.根据权利要求1所述的方法,其中,所述分类模型为Inception-ResNetv2模型,采用类别均匀采样的方式进行样本选择,并加入标签平滑和混合策略,采用cosine学习率衰减策略,训练损失采用交叉熵损失函数。


7.根据权利要求1所述的方法,其中,所述检索模型通过如下步骤构建:
提取预定图像库中各图像的特征,其中,所述图像库中各图像与类别相对应;
将所述各图像的特征进行降维处理;
对降维后的各图像的特征构建索引,其中,所述索引包括正排索引和/或倒排索引。


8.根据权利要求4所述的方法,其中,所述主体检测模型采用Faster-RCNN。


9.根据权利要求5所述的方法,其中,所述二分类模型采用ResNet-34模型。


10.一种用于图像识别的装置,包括:
获取单元,被配置成获取待识别的物体的图像;
分类单元,被配置成将所述图像输入预先训练的分类模型,得到分类预测结果和物体的特征;
第一计算单元,被配置成基于所述分类预测结果计算所述分类预测结果的可信度;
...

【专利技术属性】
技术研发人员:张滨韩树民冯原李振东刘静伟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1