用于识别对象的方法和装置制造方法及图纸

技术编号:23774700 阅读:43 留言:0更新日期:2020-04-12 03:32
本公开涉及一种人工智能(AI)系统及其应用,该人工智能系统用于通过使用诸如深度学习的机器学习算法来模拟人脑的诸如认知和决策的功能。具体地,本公开提供了一种通过使用AI系统及其应用来识别对象的方法,包括:提取分别关于多个图像的多条第一特征信息,每个图像包括对象;通过将所提取的分别关于多个图像的多条第一特征信息组合在一起,生成表示多个图像之间的相关性的至少一条第二特征信息;以及基于至少一条第二特征信息,通过使用预先生成的学习网络模型来识别被包括在多个图像的每一个图像中的对象。

Methods and devices for identifying objects

【技术实现步骤摘要】
【国外来华专利技术】用于识别对象的方法和装置
本公开涉及对象识别方法、对象识别装置和其上记录有用于执行对象识别方法的程序的记录介质。
技术介绍
人工智能(artificialintelligence,AI)系统是一种计算机系统,与现有的基于规则的智慧系统相比,它实现了人类水平的智能,并且使机器通过自主学习和做出决策变得有智慧。AI系统可以提高它们的识别率,并且能够通过实践更准确地理解用户的偏好。因此,现有的基于规则的智慧系统越来越多地被基于深度学习的AI系统取代。AI技术由机器学习(深度学习)和使用机器学习的元件技术构成。机器学习是对输入数据的特征进行自动分类/学习的算法技术,元件技术是通过使用机器学习算法来模拟人脑的功能(诸如,认知和决策)的技术,并且包括诸如语言理解、视觉理解、推理/预测、知识表示、运动控制等
AI技术所应用的各种
如下。语言理解是为应用/处理而识别人类语言/字符的技术,并且包括自然语言处理、机器翻译、对话系统、问答、语音识别/合成等。视觉理解是以与人类视觉系统所执行的相同方式来识别和处理对象的技术,并且包括对象识别、对象跟踪、图像检索、人识别、场景理解、空间理解、图像增强等。推理/预测是判断信息、逻辑推断和预测新信息的技术,并且包括基于知识/概率的干扰、优化预测、基于偏好的规划、推荐等。知识表示是将关于人类经验的信息作为知识数据来进行自动处理的技术,并且包括知识构建(数据生成/分类)、知识管理(数据利用)等。运动控制是控制车辆的自主驾驶和机器人的运动的技术,并且包括移动控制(导航、避碰和行驶)、操纵控制(动作控制)等。
技术实现思路
技术问题提供了一种对象识别方法和装置以及一种记录介质,由此通过从包括特定对象的多个图像中提取该特定对象的非结构化特征并且将组合所提取的对象特征的结果用于对象的识别,可以有效地识别图像中的对象。问题的解决方案本公开提供了一种通过使用人工智能系统及其应用来识别对象的方法,该方法包括:提取分别关于多个图像的多条第一特征信息,每个图像包括对象;通过将所提取的分别关于多个图像的多条第一特征信息组合在一起,生成表示多个图像之间的相关性的至少一条第二特征信息;以及基于该至少一条第二特征信息,通过使用预先生成的学习网络模型来识别被包括在多个图像中的每一个图像中的对象。附图说明图1是用于解释根据实施例的由对象识别装置执行的对象识别方法的概念图。图2是根据实施例的由对象识别装置执行的对象识别方法的流程图。图3是用于解释根据实施例的由对象识别装置执行的经由多个图像的多条特征信息的组合来识别被包括在目标图像中的对象的方法的图。图4是根据实施例的由对象识别装置执行的通过使用从多个图像中选择的图像来识别目标图像中的对象的方法的流程图。图5是用于解释根据实施例的由对象识别装置执行的选择要用于对象识别的图像的方法的流程图。图6是用于解释根据实施例的由对象识别装置执行的基于运动信息从多个图像中提取用于对象识别的特定区域的方法的图。图7是用于解释根据实施例的由对象识别装置用来识别对象的学习网络模型的图。图8是用于更详细地解释根据实施例的由对象识别装置用来识别对象的第二学习网络模型的图。图9是用于解释根据实施例的第二学习网络模型中的差异学习层的图。图10是用于解释根据实施例的第二学习网络模型中的一致性学习层的图。图11是用于解释根据实施例的第二学习网络模型中的集成层(integrationlayer)的图。图12是根据实施例的用于识别对象的对象识别装置的配置的框图。图13是用于解释根据实施例的处理器的图。图14是根据实施例的数据学习单元的框图。图15是根据实施例的数据标识单元的框图。图16是根据另一实施例的对象识别装置的配置的框图。最佳实施方式根据实施例,一种对象识别方法包括:提取分别关于多个图像的多条第一特征信息,每个图像包括对象;通过将所提取的分别关于多个图像的多条第一特征信息组合在一起,生成表示多个图像之间的相关性(correlation)的至少一条第二特征信息;以及基于该至少一条第二特征信息,通过使用预先生成的学习网络模型来识别被包括在多个图像中的每一个图像中的对象。在对象识别方法中,生成至少一条第二特征信息可以包括通过线性组合所提取的分别关于多个图像的多条第一特征信息来生成表示多个图像之间的相似性(similarity)和差异中的至少一个的第二特征信息。根据实施例,一种对象识别装置包括:存储器,用于存储一个或多个指令;输出单元;以及处理器,被配置为执行存储在存储器中的一个或多个指令,以用于:提取分别关于多个图像的多条第一特征信息,每个图像包括对象;通过将所提取的分别关于多个图像的多条第一特征信息组合在一起,生成表示多个图像之间的相关性的至少一条第二特征信息;以及基于该至少一条第二特征信息,通过使用预先生成的学习网络模型来识别被包括在多个图像中的每一个图像中的对象。本公开的实施方式现在将简要描述本文使用的术语,然后将详细描述本公开。本公开中使用的术语基于在本公开中描述的功能是本领域当前广泛使用的通用术语,但是可以根据本领域普通技术人员的意图、先例或者新技术的出现而具有不同含义。此外,一些术语可以由申请人任意选择,并且在这种情况下,所选择的术语的含义将在本公开的详细描述中详细描述。因此,本文使用的术语不应由其简单的名称(appellation)来定义,而是基于术语的含义以及本公开的总体描述来定义。应当理解,尽管包括序数(诸如“第一”、“第二”等)的术语可以在本文中用来描述各种元件,但是这些元件不应该受到这些术语的限制。这些术语仅用来区分一个元素和另一元素。例如,在不脱离本公开范围的情况下,下面将要讨论的第一元件可以被称为第二元件。类似地,第二元件可以被称为第一元件。如本文所使用的,术语“和/或”包括一个或多个相关列出项的任何和所有组合。贯穿说明书,当部件“包括”或“包含”元件时,除非有相反的特定描述,否则该部件还可以包括其他元件,而不排除其他元件。此外,如本文所使用的,术语“单元”表示软件元件或硬件元件,诸如现场可编程门阵列(FPGA)或专用集成电路(ASIC),并且执行某些功能。然而,术语“单元”不限于软件或硬件。“单元”可以被形成为位于可寻址的存储介质中,或者可以被形成为操作一个或多个处理器。因此,例如,术语“单元”可以包括诸如软件元件、面向对象的软件元件、类元件和任务元件、处理、函数、属性、过程、子程序、程序代码段、驱动、固件、微代码、电路、数据、数据库、数据结构、表、数组或变量的元件。由元件和“单元”提供的功能可以被组合成更少数量的元件和“单元”,或者可以被划分成附加的元件和“单元”。现在将在下文中参考附图更全面地描述本公开的实施例,使得本领域普通技术人员可以容易地实施它们。然而,本公开可以具有不同的形式,并且不应被解释为局限于本文所阐述的描述。省本文档来自技高网
...

【技术保护点】
1.一种对象识别方法,包括:/n提取分别关于多个图像的多条第一特征信息,每个图像包括对象;/n通过将所提取的分别关于多个图像的多条第一特征信息组合在一起,生成表示所述多个图像之间的相关性的至少一条第二特征信息;以及/n基于所述至少一条第二特征信息,通过使用预先生成的学习网络模型来识别被包括在所述多个图像中的每一个图像中的所述对象。/n

【技术特征摘要】
【国外来华专利技术】20170808 KR 10-2017-01005141.一种对象识别方法,包括:
提取分别关于多个图像的多条第一特征信息,每个图像包括对象;
通过将所提取的分别关于多个图像的多条第一特征信息组合在一起,生成表示所述多个图像之间的相关性的至少一条第二特征信息;以及
基于所述至少一条第二特征信息,通过使用预先生成的学习网络模型来识别被包括在所述多个图像中的每一个图像中的所述对象。


2.根据权利要求1所述的对象识别方法,其中,生成所述至少一条第二特征信息包括通过线性组合所提取的分别关于所述多个图像的多条第一特征信息来生成表示所述多个图像之间的相似性和差异中的至少一个的所述至少一条第二特征信息。


3.根据权利要求1所述的对象识别方法,其中,生成所述至少一条第二特征信息包括:
相互比较所提取的分别关于所述多个图像的多条第一特征信息,并且从所述多个图像中选择其对应的多条第一特征信息之间的差异在预设范围内的多个图像;并且
将分别关于所选择的多个图像的多条第一特征信息组合在一起。


4.根据权利要求1所述的对象识别方法,还包括确定所述多个图像中的每一个图像中所述对象位于的区域,
其中,每条第一特征信息的提取包括从所确定的区域中提取所述对象的第一特征信息。


5.根据权利要求1所述的对象识别方法,其中,所述对象的识别包括:
根据生成所述至少一条第二特征信息所基于的多条第一特征信息的组合的类型,为被输入到所述预先生成的学习网络模型的所述至少一条第二特征信息设置权重;以及
通过根据设置的权重将所述至少一条第二特征信息应用于预先生成的学习网络模型来识别对象。


6.根据权利要求1所述的对象识别方法,其中,所述对象的识别包括基于所述至少一条第二特征信息和关于所述多个图像中的至少一些图像的多条第一特征信息,通过使用所述预先生成的学习网络模型来识别所述对象。


7.根据权利要求1所述的对象识别方法,还包括:
根据所述对象的特征、所述对象的移动和拍摄设备的移动中的至少一个,获取所述对象的不同形状的多个捕获的训练图像;以及
基于获取的多个训练图像,确定构成学习网络模型的多个层的参数。


8.一种对象识别装置,包括:
存储器,其存储一个或多个指令;
输出单元;以及
处理器,其被配置为执行存储在存储器中的所述一个或多个指...

【专利技术属性】
技术研发人员:郑玹朱李建熙崔寅权金圣晋崔贤秀
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1