用于卷积神经网络的超像素方法技术

技术编号：28475027 阅读：27 留言：0更新日期：2021-05-15 21:43

本申请涉及用于卷积神经网络的超像素方法。该方法包括将X乘Y乘Z输入张量变换为X

全部详细技术资料下载

【技术实现步骤摘要】
用于卷积神经网络的超像素方法
[0001]分案说明
[0002]本申请属于申请日为2017年7月13日的中国专利技术专利申请201710570292.6的分案申请。

[0003]本说明书涉及通过神经网络的层处理输入来生成输出。

技术介绍

[0004]神经网络是一种对于所接收的输入采用一层或多层的非线性单元来预测输出的机器学习模型。一些神经网络除输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作该网络中的另一层—例如下一隐藏层或输出层
‑
的输入。该网络的每一层依据相应的参数集的当前值来根据所接收的输入生成输出。

技术实现思路

[0005]大体上，本说明书中描述的主题的一个创新方面能够体现在用于更有效率地执行卷积神经网络层的计算的方法中，所述卷积神经网络层被配置来接收X乘Y乘Z输入张量并且使用一个或多个卷积神经网络层权重矩阵处理所接收的输入张量来生成U乘V乘W输出张量。在一些方面中，所述方法包括：将所述X乘Y乘Z输入张量变换为X
’
乘Y
’
乘Z
’
输入张量，其中，X
’
小于或等于X，Y
’
小于或等于Y，并且Z
’
大于或等于Z；获得一个或多个经修改的卷积神经网络层权重矩阵，其中(i)经修改的权重矩阵对所述X
’
乘Y
’
乘Z
’
输入张量进行运算以生成U
’
乘V
’
乘W
>’
输出张量，并且(ii)所述U
’
乘V
’
乘W
’
输出张量包括经变换的U乘V乘W输出张量，其中，U
’
小于或等于U，V
’
小于或等于V，并且W
’
大于或等于W；以及使用经修改的权重矩阵处理所述X
’
乘Y
’
乘Z
’
输入张量以生成所述U
’
乘V
’
乘W
’
输出张量，其中，所述U
’
乘V
’
乘W
’
输出张量包括所述U乘V乘W输出张量。
[0006]此方面的其他实施例包括对应的计算机系统、装置、和记录在一个或多个计算机存储设备上的计算机程序，其均配置来执行所述方法的动作。一个或多个计算机的系统能够被配置成依靠安装在系统上的软件、固件、硬件、或者以上的任何组合来执行特定操作或动作，所述软件、固件、硬件、或者以上的任何组合在操作时可以使得所述系统执行所述动作。一个或多个计算机程序能够被配置成依靠包括指令来执行特定操作或动作，所述指令在由数据处理装置执行时使得所述装置执行所述动作。
[0007]前述实施例和其他实施例均能够可选地独自或以组合方式包括以下特征中的一个或多个。
[0008]在一些实施方式中，X
’
等于X除以自然数N的向上舍入，Y
’
等于Y除以自然数M的向上舍入，并且Z
’
等于Z乘以NM。
[0009]在一些实施方式中，所述X乘Y乘Z输入张量表示XY个第一输入并且所述X
’
乘Y
’
乘Z
’
输入张量表示X
’
Y
’
个超级输入，其中每个超级输入包括多个第一输入。
[0010]在一些实施方式中，所述多个第一输入的数目等于NM个输入。
[0011]在一些情况下，经修改的权重矩阵对所述X
’
乘Y
’
乘Z
’
输入张量的运算等同于所述卷积神经网络层权重矩阵对所述X乘Y乘Z输入张量的运算。
[0012]在一些实施方式中，经修改的权重矩阵的元(entry)包括一个或多个卷积神经网络层权重矩阵。
[0013]在一些情况下，经修改权的重矩阵包括具有带状结构的矩阵。
[0014]在一些实施方式中，U
’
等于U除以自然数P的向上舍入，V
’
等于V除以自然数Q的向上舍入，并且W
’
等于W乘以PQ。
[0015]在一些实施方式中，所述U乘V乘W输出张量表示UV个第一输出并且所述U
’
乘V
’
乘W
’
输出张量表示U
’
V
’
个超级输出，其中每个超级输出包括多个第一输出。
[0016]在一些情况下，所述多个第一输出等于PQ个输出。
[0017]在一些实施方式中，所述卷积神经网络层包括池化子层。
[0018]在一些情况下，所述方法进一步包括将所述聚合子层替换为在经变换的输入张量上的跨步。
[0019]在一些实施方式中，所述卷积神经网络层包括X维度上的步幅S和Y维度上的步幅T，并且其中，步幅S、步幅T、输出张量U乘V乘W以及经变换输出张量U
’
乘V
’
乘W
’
之间的关系为：U
’
＝ceiling(U/NS)和V
’
＝ceiling(V/MT)。
[0020]在一些情况下，所述U乘V乘W输出张量表示UV个第一输出并且所述U
’
乘V
’
乘W
’
输出张量表示U
’
V
’
个超级输出，其中每个超级输出包括多个第一输出，并且所述多个第一输出中的第一输出的数目取决于所述卷积神经网络层权重矩阵的维度。
[0021]在一些实施方式中，所述U乘V乘W输出张量表示UV个第一输出并且所述U
’
乘V
’
乘W
’
输出张量表示U
’
V
’
个超级输出，其中每个超级输出包括多个第一输出，并且所述多个第一输出中的输出的数目取决于以下中的一个或多个：(i)所述卷积神经网络层的架构，(ii)包括所述卷积神经网络层的神经网络模型的架构，或者(iii)实现所述卷积神经网络层的设备。
[0022]在一些情况下，对所述一个或多个卷积神经网络层权重矩阵的所述修改是仅软件修改。
[0023]本说明书中所描述的主题能够被实现在特定实施例中以便实现以下优点中的一个或多个。
[0024]卷积神经网络层能够使用矩阵乘法运算来计算。然而，当卷积神经网络层的输入或输出深度浅的时候，软件库和硬件矩阵乘法单元二者可能以低效率来执行，因为这些输入和输出深度映射到相乘的矩阵中的一个的维度。作为一个示例，输入图像可以具有RGB数据，得到3的输入深度，并且该卷积神经网络层可以产生16的输出深度，其中3和16在以上意义下是浅的。这产生了低效率，因为典型的现代计算机架构由于其缓存、存储器存取和计算单元的架构设计，能够以与具有浅深度的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于更有效率地执行卷积神经网络层的计算的计算机实现的方法，所述卷积神经网络层被配置来接收X乘Y乘Z输入张量并且使用一个或多个卷积神经网络层权重矩阵处理所接收的输入张量来生成U乘V乘W输出张量，所述方法包括：接收所述X乘Y乘Z输入张量，所述输入张量包括深度Z的XY个第一输入，其中，X和Y表示空间范围，并且Z表示深度范围；生成X
’
乘Y
’
乘Z
’
经修改的输入张量，其中，X
’
小于或等于X，Y
’
小于或等于Y，并且Z
’
大于或等于Z，包括：将两个或更多个所述第一输入聚组在一起；以及通过将所聚组的第一输入的空间范围转换成深度范围来生成X
’
Y
’
个超级输入，从而所述深度范围换得所述空间范围以增加所述卷积神经网络层的计算效率；获得一个或多个经修改的卷积神经网络层权重矩阵，其中(i)经修改的权重矩阵对所述X
’
乘Y
’
乘Z
’
经修改的输入张量进行运算以生成U
’
乘V
’
乘W
’
经修改的输出张量，并且(ii)所述U
’
乘V
’
乘W
’
经修改的输出张量包括经变换的U乘V乘W输出张量，其中，U
’
小于或等于U，V
’
小于或等于V，并且W
’
大于或等于W；以及对所述经修改的输入执行具有所述经修改的权重矩阵的经修改的卷积神经网络层的计算以生成所述U
’
乘V
’
乘W
’
经修改的输出张量，其中，所述U
’
乘V
’
乘W
’
经修改的输出张量包括所述U乘V乘W输出张量，该U乘V乘W输出张量对应于当处理所述X乘Y乘Z输入张量时由所述卷积神经网络层生成的输出。2.一种系统，包括一个或多个计算机和存储指令的一个或多个存储设备，所述指令可操作在由所述一个或多个计算机执行时使得所述一个或多个计算机执行用于更有效率地执行卷积神经网络层的计算的操作，所述卷积神经网络层被配置来接收X乘Y乘Z输入张量并且使用一个或多个卷积神经网络层权重矩阵处理所接收的输入张量来生成U乘V乘W输出张量，所述操作包括：接收所述X乘Y乘Z输入张量，所述输入张量包括深度Z的XY个第一输入，其中，X和Y表示空间范围，并且Z表示深度范围；生成X
’
乘Y
’
乘Z
’
经修改的输入张量，其中，X
’
小于或等于X，Y
’
小于或等于Y，并且Z
’
大于或等于Z，包括：将两个或更多个所述第一输入聚组在一起；以及通过将所聚组的第一输入的空间范围转换成深度范围来生成X
’
Y
’
个超级输入，从而所述深度范围换得所述空间范围以增加所述卷积神经网络层的计算效率；获得一个或多个经修改的卷积神经网络层权重矩阵，其中(i)经修改的权重矩阵对所述X
’
乘Y

【专利技术属性】
技术研发人员：雷吉纳尔德，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人