用于识别图像的方法和设备技术

技术编号:27528253 阅读:22 留言:0更新日期:2021-03-03 10:59
提供一种用于识别图像的方法和设备。所述处理数据的方法包括:基于包括在输入数据中的有效信息,识别输入数据的稀疏性;基于稀疏性的形式重新排列输入数据;和通过处理重新排列的输入数据来生成输出数据。的输入数据来生成输出数据。的输入数据来生成输出数据。

【技术实现步骤摘要】
用于识别图像的方法和设备
[0001]本申请要求于2019年8月26日在韩国知识产权局提交的第10-2019-0104578号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。


[0002]下面的描述涉及用于处理数据的方法和设备。更具体地,涉及用于识别图像的方法和设备。

技术介绍

[0003]神经网络表示使用生物大脑作为模型的计算架构。根据神经网络技术的最新发展,通过在各种类型的电子系统中使用神经网络设备来分析输入数据,并提取有效信息。
[0004]神经网络设备针对输入数据执行大量的操作。已对能够高效地处理神经网络操作的技术进行研究。神经网络设备已经广泛用于图像识别。

技术实现思路

[0005]提供本
技术实现思路
来以简化的形式介绍在以下具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在标识要求权利的主题的关键特征或必要特征,也不意在用于帮助确定要求权利的主题的范围。
[0006]用于处理数据的方法和设备、以及在其上记录有用于在计算机上执行所述方法的程序的计算机可读记录介质被提供。
[0007]在一个总体方面,一种识别图像的方法包括:获得输入图像;基于包括在输入图像中的有效信息,识别作为输入数据的输入图像的稀疏性;基于输入图像的稀疏性的形式重新排列输入图像;在至少一个卷积层上通过对重新排列的输入图像执行卷积运算来生成最终特征图;以及基于最终特征图来获得识别结果。
[0008]生成最终特征图的步骤可包括:识别每个卷积层的输入数据的稀疏性;基于稀疏性的形式重新排列输入数据;在每个卷积层上通过对重新排列的输入数据执行卷积运算来生成输出特征图,其中,所述至少一个卷积层中的首层卷积层的输入数据为重新排列的输入图像,所述至少一个卷积层中的最后层卷积层输出的输出特征图为最终特征图。
[0009]重新排列输入数据的步骤可包括:基于包括在输入数据中的无效值的分布来重新排列输入数据。
[0010]重新排列输入数据的步骤可包括:基于包括在输入数据的多个行中的每个行中的无效值的数量,来重新排列包括在输入数据中的所述多个行。
[0011]重新排列输入数据的步骤可包括:执行重新排列,使得输入数据的所述多个行之中的包括最多无效值的输入数据的第一行与输入数据的所述多个行之中的包括最少无效值的输入数据的第二行相邻。
[0012]重新排列输入数据的步骤可包括:根据第一规则移位包括在输入数据中的多个列的元素。
[0013]第一规则可包括将包括在输入数据中的所述多个列的元素沿相同方向移位特定大小,并且第一规则可被周期性地应用于包括在输入数据中的所述多个列。
[0014]重新排列输入数据的步骤可包括:重新排列包括在输入数据中的所述多个列,以跳过关于在包括在输入数据中的多个列之中的仅包括无效值的至少一个列的处理。
[0015]重新排列输入数据的步骤可包括:将包括在输入数据中的第一列的第一元素移位到与输入数据的与第一列相邻的第二列的最后的元素对应的位置。
[0016]生成最终特征图的步骤可包括:将第二规则和第三规则中的一个或两个应用于重新排列的输入数据;和对应用了第二规则和第三规则中的一个或两个的重新排列的输入数据和另外的数据执行卷积运算。
[0017]在另一总体方面,一种非暂时性计算机可读记录介质,在其上记录了用于在计算机上执行所述方法的程序。
[0018]在另一总体方面,一种用于识别图像的设备,包括:存储器,至少一个程序被存储在存储器中;和处理器,被配置为执行所述至少一个程序,其中,处理器被配置为:获得输入图像;基于包括在输入图像中的有效信息,识别作为输入数据的输入图像的稀疏性;基于输入图像的稀疏性的形式重新排列输入图像;在至少一个卷积层上通过对重新排列的输入图像执行卷积运算来生成最终特征图;以及基于最终特征图来获得识别结果。
[0019]处理器还可被配置为:通过以下步骤来生成最终特征图:识别每个卷积层的输入数据的稀疏性,基于稀疏性的形式重新排列输入数据,在每个卷积层上通过对重新排列的输入数据执行卷积运算生成输出特征图,其中,所述至少一个卷积层中的首层卷积层的输入数据为重新排列的输入图像,所述至少一个卷积层中的最后层卷积层输出的输出特征图为最终特征图。
[0020]在另一总体方面,一种用于识别图像的设备,包括:一个或多个存储器,存储一个或多个程序;和一个或多个处理器,被配置为执行所述一个或多个程序中的至少一个以:获得输入图像,确定作为输入数据的输入图像中的包括无效值的位置,通过操作输入数据中的包括无效值的位置来生成重新排列的数据,将规则应用于重新排列的数据,在至少一个卷积层上通过对应用了规则的重新排列的数据执行卷积运算来生成最终特征图,以及基于最终特征图来获得识别结果。
[0021]所述一个或多个处理器可执行所述一个或多个程序中的至少一个,以通过将包括在输入数据中的有效值移位到输入数据中的包括无效值的位置来生成重新排列的数据。
[0022]所述一个或多个处理器可执行所述一个或多个程序中的至少一个,以通过将无效值移位到输入数据中的另外的位置来生成重新排列的数据。
[0023]所述一个或多个处理器可执行所述一个或多个程序中的至少一个,以通过从输入数据去除无效值来生成重新排列的数据。
[0024]所述一个或多个处理器可执行所述一个或多个程序中的至少一个,以将规则应用于包括在重新排列的数据的窗口中的有效值,来使包括在将被输入到逻辑电路的窗口的输入层中的无效值的总数最小化。
[0025]规则可包括:将包括在重新排列的数据的窗口的与输入层相邻的层中的至少一个有效值移位到输入层的包括无效值的相应位置。
[0026]规则可包括:将包括在重新排列的数据的窗口的与输入层相邻的层中的至少一个
有效值移位到输入层的包括无效值的横向位置。
[0027]在另一总体方面,一种处理数据的方法,包括:基于包括在输入数据中的有效信息,识别输入数据的稀疏性;基于稀疏性的形式重新排列输入数据;和通过处理重新排列的输入数据来生成输出数据。
[0028]在另一总体方面,一种用于处理数据的设备,包括:存储器,至少一个程序被存储在存储器中;和处理器,被配置为执行所述至少一个程序以:基于包括在输入数据中的有效信息,识别输入数据的稀疏性;基于稀疏性的形式重新排列输入数据;并且通过处理重新排列的输入数据来生成输出数据。
[0029]在另一总体方面,一种用于处理数据的设备,包括:一个或多个存储器,存储一个或多个程序;和一个或多个处理器,被配置为执行所述一个或多个程序中的至少一个以:确定输入数据中的包括无效值的位置,通过操作输入数据中的包括无效值的位置来生成重新排列的数据,以及将规则应用于重新排列的数据。
[0030]从下面的具体实施方式、附图和权利要求,其他特征和方面将是清楚的。
附图说明
[0031]图1是示出神经网络的架构的示图。
[0032]图2和图3是示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别图像的方法,所述方法包括:获得输入图像;基于包括在输入图像中的有效信息,识别作为输入数据的输入图像的稀疏性;基于输入图像的稀疏性的形式重新排列输入图像;基于重新排列的输入图像来生成最终特征图;和基于最终特征图来获得识别结果。2.根据权利要求1所述的方法,生成最终特征图的步骤包括:识别每个卷积层的输入数据的稀疏性;基于稀疏性的形式重新排列输入数据;和在每个卷积层上通过对重新排列的输入数据执行卷积运算来生成输出特征图,其中,至少一个卷积层中的首层卷积层的输入数据为重新排列的输入图像,所述至少一个卷积层中的最后层卷积层输出的输出特征图为最终特征图。3.根据权利要求1所述的方法,其中,重新排列输入数据的步骤包括:基于包括在输入数据中的无效值的分布来重新排列输入数据。4.根据权利要求1所述的方法,其中,重新排列输入数据的步骤包括:基于包括在输入数据的多个行中的每个行中的无效值的数量,来重新排列包括在输入数据中的所述多个行。5.根据权利要求4所述的方法,其中,重新排列输入数据的步骤包括:执行重新排列,使得输入数据的所述多个行之中的包括最多无效值的输入数据的行与输入数据的所述多个行之中的包括最少无效值的输入数据的行相邻。6.根据权利要求1所述的方法,其中,重新排列输入数据的步骤包括:根据第一规则移位包括在输入数据中的多个列的元素。7.根据权利要求6所述的方法,其中,第一规则包括将包括在输入数据中的所述多个列的元素沿相同方向移位特定大小,并且第一规则被周期性地应用于包括在输入数据中的所述多个列。8.根据权利要求1所述的方法,其中,重新排列输入数据的步骤包括:重新排列包括在输入数据中的多个列,以跳过关于在包括在输入数据中的所述多个列之中的仅包括无效值的至少一个列的处理。9.根据权利要求1所述的方法,其中,重新排列输入数据的步骤包括:将包括在输入数据中的第一列的有效值移位到与输入数据的与第一列相邻的第二列的无效值对应的位置。10.根据权利要求1所述的方法,其中,生成最终特征图的步骤包括:将第二规则和第三规则中的一个或两个应用于重新排列的输入数据;和对应用了第二规则和第三规则中的一个或两个的重新排列的输入数据和另外的数据执行卷积运算。11.一种非暂时性计算机可读记录介质,在所述非暂时性计算机可读记录介质上记录了用于在计算机上执行权利要求1至10中的任意一项所述的方法的程序。12.一种用于识别图像的设备,所述设备包括:存储器,至少一个程序被存储在存储器中;和
处理器,被配置为执行所述至少一个程序以:获得输入图像;基于包括在输入图像中的有效信息,识别作为输入数据的输入图像的稀疏性;基于输入图像的稀疏性的形式重新排列输入图像;基于重新排列的输入图像来生成最终特征图;和基于最终特征图来获得识别结果。13.根据权利要求12所述的设备,其中,处理器还被配置为:执行所述至少一个程序,以通过以下步骤来生成最终特征图:识别每个卷积层的输入数据的稀疏性,基于稀疏性的形式重新排列输入数据,和在每个卷积层上通过对重新排列的输入数据执行卷积运算生成输出特征图来生成最终特征图,其中,至少一个卷积层中的首层卷积层的输入数据为重新排列的输入图像,所述至少一个卷积层中的最后层卷积层输出的输出特征图为最终特征图。14.根据权利要求12所述的设备,其中,处理器还被配置为:执行所述至少一个程序,以基于包括在输入数据中的无效值的分布来...

【专利技术属性】
技术研发人员:朴炫宣金愈珍俞炯硕李世焕张准祐
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1