图像分类神经网络制造技术

技术编号:19562028 阅读:32 留言:0更新日期:2018-11-25 00:33
一种神经网络系统,其包括子网络,所述子网络包括第一子网络,所述第一子网络包括多个第一模块,每个第一模块包括:直通卷积层,所述直通卷积层处理子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其处理所述第一子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第一堆栈,其处理所述子网络输入以生成第一堆栈输出;卷积神经网络层的第二堆栈,其处理所述子网络输入以生成第二堆栈输出;以及级联层,其级联所述生成的输出以生成第一模块输出。通过将模块子网络包括在深度神经网络中,所述深度神经网络可以更好地执行图像处理任务,并且可以更快且更有效地来训练,同时维持所述图像处理任务的改进性能。

Image Classification Neural Network

A neural network system includes a sub-network, the sub-network includes a first sub-network, the first sub-network includes a plurality of first modules, each of which includes a through convolution layer, the through convolution layer processes the input of the sub-network to generate a through output, and the average aggregation stack of the neural network layer, its processing station. The sub-network input of the first sub-network is described to generate the average aggregate output; the first stack of the convolution neural network layer processes the sub-network input to generate the first stack output; the second stack of the convolution neural network layer processes the sub-network input to generate the second stack output; and the cascade layer, which cascades. The generated output is used to generate the first module output. By incorporating the module subnetwork into the depth neural network, the depth neural network can perform image processing tasks better, and can be trained faster and more effectively, while maintaining the improved performance of the image processing tasks.

【技术实现步骤摘要】
【国外来华专利技术】图像分类神经网络相关申请的交叉引用本申请要求2016年2月18日提交的美国临时申请序列号62/297,101的优先权。在先申请的公开内容被认为是本申请的公开内容的一部分,并且通过引用并入本申请的公开内容中。
技术介绍
本说明书涉及使用深度神经网络(例如卷积神经网络)处理图像。卷积神经网络通常包括至少两种神经网络层、卷积神经网络层和完全连接的神经网络层。卷积神经网络层具有稀疏连接性,其中卷积层中的每个节点仅从下一个最低神经网络层中的节点的子集接收输入。一些卷积神经网络层具有与层中的其他节点共用权重的节点。然而,完全连接层中的节点从下一个最低神经网络层中的每个节点接收输入。
技术实现思路
一般来讲,本说明书中描述的主题的一个创新方面可以体现在一种第一神经网络系统中,所述第一神经网络系统被配置来接收图像并且生成输入图像的分类输出。所述第一神经网络系统可以实现为一个或多个位置中的一个或多个计算机上的计算机程序。所述第一神经网络系统可以包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第一子网络,所述第一子网络包括多个第一模块,每个第一模块包括:直通卷积层,所述直通卷积层被配置来处理所述第一子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第一子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第一堆栈,其中所述第一堆栈中的各层被配置来共同处理所述第一子网络的所述子网络输入以生成第一堆栈输出;卷积神经网络层的第二堆栈,其中所述第二堆栈中的各层被配置来共同处理所述第一子网络的所述子网络输入以生成第二堆栈输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第一堆栈输出和所述第二堆栈输出,以生成所述第一模块的第一模块输出。前述和其他实施例可以各自可选地单独或组合地包括以下特征中的一个或多个。所述第一子网络包括四个第一模块。所述直通卷积层是1x1卷积层。所述平均汇集堆栈包括平均汇集层,之后是1x1卷积层。所述第一堆栈包括1x1卷积层,之后是3x3卷积层。所述第二堆栈包括1x1卷积层,之后是3x3卷积层,之后是3x3卷积层。所述第一子网络被配置来组合由所述多个第一子网络生成的所述第一模块输出,以生成所述第一子网络的第一子网络输出。所述第一子网络接收35x35x384的输入,并且每个第一模块生成35x35x384的输出。本说明书中描述的主题的另一个创新方面可以体现在一种第二神经网络系统中,所述第二神经网络系统被配置来接收图像并且生成输入图像的分类输出。所述第二神经网络系统可以由一个或多个计算机实现,并且被配置来接收图像并生成输入图像的分类输出。所述第二神经网络系统可以包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第二子网络,所述第二子网络包括多个第二模块,每个第二模块包括:直通卷积层,所述直通卷积层被配置来处理所述第二子网络的所述子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第三堆栈,其中所述第三堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成第三堆栈输出;卷积神经网络层的第四堆栈,其中所述第四堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成第四堆栈输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第三堆栈输出和所述第四堆栈输出,以生成所述第二模块的第二模块输出。前述和其他实施例可以各自可选地单独或组合地包括以下特征中的一个或多个。所述第二子网络可以包括七个第二模块。所述直通卷积层可以是1x1卷积层。所述平均汇集堆栈可以包括平均汇集层,之后是1x1卷积层。所述第三堆栈可以包括1x1卷积层,之后是1x7卷积层,之后是1x7卷积层。所述第四堆栈可以包括1x1卷积层,之后是1x7卷积层,之后是7x1卷积层,之后是1x7卷积层,之后是7x1卷积层。所述第二子网络可以被配置来组合由所述多个第二模块生成的所述第二模块输出,以生成所述第二子网络的第二子网络输出。所述第二子网络可以接收17x17x1024的输入,并且每个第一模块生成17x17x1024的输出。本说明书中描述的主题的另一个创新方面可以体现在一种第三神经网络系统中,所述第三神经网络系统由一个或多个计算机实现并且被配置来接收图像并生成所述输入图像的分类输出。所述第三神经网络系统可以包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第三子网络,所述第三子网络包括多个第三模块,每个第三模块包括:直通卷积层,所述直通卷积层被配置来处理所述第三子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第一组,其中所述第一组中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成第一组输出;卷积神经网络层的第二组,其中所述第二组中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成第二组输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第一组输出和所述第二组输出,以生成所述第三模块的第三模块输出。前述和其他实施例可以各自可选地单独或组合地包括以下特征中的一个或多个。所述第二子网络包括三个第二模块。所述直通卷积层可以是1x1卷积层。所述平均汇集堆栈可以包括平均汇集层,之后是1x1卷积层。所述第一组可以包括:1x1卷积层,其被配置来处理所述第三子网络的所述子网络输入以生成第一中间输出;1x3卷积层,其被配置来处理所述第一中间输出以生成第二中间输出;3x1卷积层,其被配置来处理所述第一中间输出以生成第三中间输出;以及第一组级联层,其被配置来级联所述第二中间输出和所述第三中间输出,以生成所述第一组输出。所述第二组可以包括:卷积层的第五堆栈,其被配置来处理所述第三子网络的所述子网络输入以生成第五堆栈输出;1x3卷积层,其被配置来处理所述第五堆栈输出以生成第四中间输出;3x1卷积层,其被配置来处理所述第五堆栈输出以生成第五中间输出;以及第二组级联层,其被配置来级联所述第四中间输出和所述第五中间输出,以生成所述第二组输出。所述第五组可以包括1x1卷积层,之后是1x3卷积层,之后是3x1卷积层。所述第三子网络可以被配置来组合由所述多个第三模块生成的所述第三模块输出,以生成所述第三子网络的第三子网络输出。所述第三子网络可以接收8x8x1536的输入,并且每个第三模块生成8x8x1536的输出。本说明书中描述的主题的另一个创新方面可以体现在一种本文档来自技高网...

【技术保护点】
1.一种由一个或多个计算机实现的神经网络系统,其中所述神经网络系统被配置来接收图像并且生成输入图像的分类输出,并且其中所述神经网络系统包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第一子网络,所述第一子网络包括多个第一模块,每个第一模块包括:直通卷积层,所述直通卷积层被配置来处理所述第一子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成平均汇集输出;卷积神经网络层的第一堆栈,其中所述第一堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成第一堆栈输出;卷积神经网络层的第二堆栈,其中所述第二堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成第二堆栈输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第一堆栈输出和所述第二堆栈输出,以生成所述第一模块的第一模块输出。

【技术特征摘要】
【国外来华专利技术】2016.02.18 US 62/297,1011.一种由一个或多个计算机实现的神经网络系统,其中所述神经网络系统被配置来接收图像并且生成输入图像的分类输出,并且其中所述神经网络系统包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第一子网络,所述第一子网络包括多个第一模块,每个第一模块包括:直通卷积层,所述直通卷积层被配置来处理所述第一子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成平均汇集输出;卷积神经网络层的第一堆栈,其中所述第一堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成第一堆栈输出;卷积神经网络层的第二堆栈,其中所述第二堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成第二堆栈输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第一堆栈输出和所述第二堆栈输出,以生成所述第一模块的第一模块输出。2.如权利要求1所述的神经网络系统,其中所述第一子网络包括四个第一模块。3.如权利要求1或2中任一项所述的神经网络系统,其中所述直通卷积层是1x1卷积层。4.如权利要求1-3中任一项所述的神经网络系统,其中所述平均汇集堆栈包括平均汇集层,之后是1x1卷积层。5.如权利要求1-4中任一项所述的神经网络系统,其中所述第一堆栈包括1x1卷积层,之后是3x3卷积层。6.如权利要求1-5中任一项所述的神经网络系统,其中所述第二堆栈包括1x1卷积层,之后是3x3卷积层,之后是3x3卷积层。7.如权利要求1-6中任一项所述的神经网络系统,其中所述第一子网络被配置来组合由所述多个第一子网络生成的所述第一模块输出,以生成所述第一子网络的第一子网络输出。8.如权利要求1-7中任一项所述的神经网络系统,其中所述第一子网络接收35x35x384的输入,并且每个第一模块生成35x35x384的输出。9.一种由一个或多个计算机实现的神经网络系统,其中所述神经网络系统被配置来接收图像并且生成输入图像的分类输出,并且其中所述神经网络系统包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第二子网络,所述第二子网络包括多个第二模块,每个第二模块包括:直通卷积层,所述直通卷积层被配置来处理所述第二子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第三堆栈,其中所述第三堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成第三堆栈输出;卷积神经网络层的第四堆栈,其中所述第四堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成第四堆栈输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第三堆栈输出和所述第四堆栈输出,以生成所述第二模块的第二模块输出。10.如权利要求9所述的神经网络系统,其中所述第二子网络包括七个第二模块。11.如权利要求9或10中任一项所述的神经网络系统,其中所述直通卷积层是1x1卷积层。12.如权利要求9-11中任一项所述的神经网络系统,其中所述平均汇集堆栈包括平均汇集层,之后是1x1卷积层。13.如权利要求9-12中任一项所述的神经网络系统,其中所述第三堆栈包括1x1卷积层,之后是1x7卷积层,之后是1x7卷积层。14.如权利要求9-13中任一项所述的神经网络系统,其中所述第四堆栈包括1x1卷积层,之后是1x7卷积层,之后是7x1卷积层,之后是1x7卷积层,之后是7x1卷积层。15.如权利要求9-14中任一项所述的神经网络系统,其中所述第二子网络被配置来组合由所述多个第二模块生成的所述第二模块输出,以生成所述第二子网络的第二子网络输出。16.如权利要求9-15中任一项所述的神经网络系统,其中所述第二子网络接收17x17x1024的输入,并且每个第一模块生成17x17x1024的输出。17.一种由一个或多个计算机实现的神经网络系统,其中所述神经网络系统被配置来接收图像并且生成输入图像的分类输出,并且其中所述神经网络系统包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第三子网络,所述第三子网络包括多个第三模块,每个第三模块包括:直通卷积层,所述直通卷积层被配置来处理所述第三子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第一组,其中所述第一组中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成第一组输出;卷积神经网络层的第二组,其中所述第二组中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成第二组输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第一组输出和所述第二组输出,以生成所述第三模块的第三模块输出。18.如权利要求17所述的神经网络系统,其中所述第二子网络包括三个第二模块。19.如权利要求17...

【专利技术属性】
技术研发人员:VO范霍克C塞格迪S伊奥弗
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1