A neural network system includes a sub-network, the sub-network includes a first sub-network, the first sub-network includes a plurality of first modules, each of which includes a through convolution layer, the through convolution layer processes the input of the sub-network to generate a through output, and the average aggregation stack of the neural network layer, its processing station. The sub-network input of the first sub-network is described to generate the average aggregate output; the first stack of the convolution neural network layer processes the sub-network input to generate the first stack output; the second stack of the convolution neural network layer processes the sub-network input to generate the second stack output; and the cascade layer, which cascades. The generated output is used to generate the first module output. By incorporating the module subnetwork into the depth neural network, the depth neural network can perform image processing tasks better, and can be trained faster and more effectively, while maintaining the improved performance of the image processing tasks.
【技术实现步骤摘要】
【国外来华专利技术】图像分类神经网络相关申请的交叉引用本申请要求2016年2月18日提交的美国临时申请序列号62/297,101的优先权。在先申请的公开内容被认为是本申请的公开内容的一部分,并且通过引用并入本申请的公开内容中。
技术介绍
本说明书涉及使用深度神经网络(例如卷积神经网络)处理图像。卷积神经网络通常包括至少两种神经网络层、卷积神经网络层和完全连接的神经网络层。卷积神经网络层具有稀疏连接性,其中卷积层中的每个节点仅从下一个最低神经网络层中的节点的子集接收输入。一些卷积神经网络层具有与层中的其他节点共用权重的节点。然而,完全连接层中的节点从下一个最低神经网络层中的每个节点接收输入。
技术实现思路
一般来讲,本说明书中描述的主题的一个创新方面可以体现在一种第一神经网络系统中,所述第一神经网络系统被配置来接收图像并且生成输入图像的分类输出。所述第一神经网络系统可以实现为一个或多个位置中的一个或多个计算机上的计算机程序。所述第一神经网络系统可以包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第一子网络,所述第一子网络包括多个第一模块,每个第一模块包括:直通卷积层,所述直通卷积层被配置来处理所述第一子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第一子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第一堆栈,其中所述第一堆栈中的各层被配置来共同处理所述第一子网络的所 ...
【技术保护点】
1.一种由一个或多个计算机实现的神经网络系统,其中所述神经网络系统被配置来接收图像并且生成输入图像的分类输出,并且其中所述神经网络系统包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第一子网络,所述第一子网络包括多个第一模块,每个第一模块包括:直通卷积层,所述直通卷积层被配置来处理所述第一子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成平均汇集输出;卷积神经网络层的第一堆栈,其中所述第一堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成第一堆栈输出;卷积神经网络层的第二堆栈,其中所述第二堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成第二堆栈输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第一堆栈输出和所述第二堆栈输出,以生成所述第一模块的第一模块输出。
【技术特征摘要】
【国外来华专利技术】2016.02.18 US 62/297,1011.一种由一个或多个计算机实现的神经网络系统,其中所述神经网络系统被配置来接收图像并且生成输入图像的分类输出,并且其中所述神经网络系统包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第一子网络,所述第一子网络包括多个第一模块,每个第一模块包括:直通卷积层,所述直通卷积层被配置来处理所述第一子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成平均汇集输出;卷积神经网络层的第一堆栈,其中所述第一堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成第一堆栈输出;卷积神经网络层的第二堆栈,其中所述第二堆栈中的各层被配置来共同处理所述第一子网络的子网络输入以生成第二堆栈输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第一堆栈输出和所述第二堆栈输出,以生成所述第一模块的第一模块输出。2.如权利要求1所述的神经网络系统,其中所述第一子网络包括四个第一模块。3.如权利要求1或2中任一项所述的神经网络系统,其中所述直通卷积层是1x1卷积层。4.如权利要求1-3中任一项所述的神经网络系统,其中所述平均汇集堆栈包括平均汇集层,之后是1x1卷积层。5.如权利要求1-4中任一项所述的神经网络系统,其中所述第一堆栈包括1x1卷积层,之后是3x3卷积层。6.如权利要求1-5中任一项所述的神经网络系统,其中所述第二堆栈包括1x1卷积层,之后是3x3卷积层,之后是3x3卷积层。7.如权利要求1-6中任一项所述的神经网络系统,其中所述第一子网络被配置来组合由所述多个第一子网络生成的所述第一模块输出,以生成所述第一子网络的第一子网络输出。8.如权利要求1-7中任一项所述的神经网络系统,其中所述第一子网络接收35x35x384的输入,并且每个第一模块生成35x35x384的输出。9.一种由一个或多个计算机实现的神经网络系统,其中所述神经网络系统被配置来接收图像并且生成输入图像的分类输出,并且其中所述神经网络系统包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第二子网络,所述第二子网络包括多个第二模块,每个第二模块包括:直通卷积层,所述直通卷积层被配置来处理所述第二子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第三堆栈,其中所述第三堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成第三堆栈输出;卷积神经网络层的第四堆栈,其中所述第四堆栈中的各层被配置来共同处理所述第二子网络的所述子网络输入以生成第四堆栈输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第三堆栈输出和所述第四堆栈输出,以生成所述第二模块的第二模块输出。10.如权利要求9所述的神经网络系统,其中所述第二子网络包括七个第二模块。11.如权利要求9或10中任一项所述的神经网络系统,其中所述直通卷积层是1x1卷积层。12.如权利要求9-11中任一项所述的神经网络系统,其中所述平均汇集堆栈包括平均汇集层,之后是1x1卷积层。13.如权利要求9-12中任一项所述的神经网络系统,其中所述第三堆栈包括1x1卷积层,之后是1x7卷积层,之后是1x7卷积层。14.如权利要求9-13中任一项所述的神经网络系统,其中所述第四堆栈包括1x1卷积层,之后是1x7卷积层,之后是7x1卷积层,之后是1x7卷积层,之后是7x1卷积层。15.如权利要求9-14中任一项所述的神经网络系统,其中所述第二子网络被配置来组合由所述多个第二模块生成的所述第二模块输出,以生成所述第二子网络的第二子网络输出。16.如权利要求9-15中任一项所述的神经网络系统,其中所述第二子网络接收17x17x1024的输入,并且每个第一模块生成17x17x1024的输出。17.一种由一个或多个计算机实现的神经网络系统,其中所述神经网络系统被配置来接收图像并且生成输入图像的分类输出,并且其中所述神经网络系统包括:多个子网络,所述多个子网络堆叠布置在彼此之上,其中每个子网络被配置来处理子网络输入以生成子网络输出并且将所述子网络输出作为输入提供给堆栈中的所述子网络上方的另一个子网络,并且其中所述多个子网络包括:第三子网络,所述第三子网络包括多个第三模块,每个第三模块包括:直通卷积层,所述直通卷积层被配置来处理所述第三子网络的子网络输入以生成直通输出;神经网络层的平均汇集堆栈,其中所述平均汇集堆栈中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成平均汇集输出;卷积神经网络层的第一组,其中所述第一组中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成第一组输出;卷积神经网络层的第二组,其中所述第二组中的各层被配置来共同处理所述第三子网络的所述子网络输入以生成第二组输出;以及级联层,所述级联层被配置来级联所述直通输出、所述平均汇集输出、所述第一组输出和所述第二组输出,以生成所述第三模块的第三模块输出。18.如权利要求17所述的神经网络系统,其中所述第二子网络包括三个第二模块。19.如权利要求17...
【专利技术属性】
技术研发人员:VO范霍克,C塞格迪,S伊奥弗,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。