用于存储卷积神经网络的方法和装置制造方法及图纸

技术编号:18427042 阅读:76 留言:0更新日期:2018-07-12 02:10
本申请实施例公开了用于存储卷积神经网络的方法和装置。该方法的一具体实施方式包括:从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层;执行如下转换步骤:将待转换卷积层转换成深度可分离卷积结构,基于转换后的卷积层,生成转换后的卷积神经网络并存储;确定转换后的卷积神经网络的识别精度;响应于确定所确定的识别精度大于等于预设阈值,从至少一个卷积层中的、未转换的卷积层中选择卷积层作为待转换卷积层,继续执行转换步骤。该实施方式实现了对卷积神经网络占用的存储空间的有效降低。

【技术实现步骤摘要】
用于存储卷积神经网络的方法和装置
本申请实施例涉及计算机
,具体涉及人工智能
,尤其涉及用于存储卷积神经网络的方法和装置。
技术介绍
目前,随着人工智能不断的发展,卷积神经网络(ConvolutionalNeuralNetwork,CNN)的应用范围也在不断的扩展。卷积神经网络可以应用于服务端,以对图像、文字、音频等进行处理。当然,现在卷积神经网络还可以包含在客户端应用中。用户通过其终端设备所安装的客户端应用中的卷积神经网络可以实现对图像、文字、音频等的编辑。现有的神经网络通常占用较多的存储空间,例如磁盘空间或内存空间等。而深度可分离卷积结构是现有的一种用于降低卷积神经网络所占用的存储空间的一种卷积神经网络结构。
技术实现思路
本申请实施例提出了用于存储卷积神经网络的方法和装置。第一方面,本申请实施例提供了一种用于存储卷积神经网络的方法,该方法包括:从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层;执行如下转换步骤:将待转换卷积层转换成深度可分离卷积结构,基于转换后的卷积层,生成转换后的卷积神经网络并存储;确定转换后的卷积神经网络的识别精度;响应于确定所确定的识别精度大于等于预设阈值,从至少一个卷积层中的、未转换的卷积层中选择卷积层作为待转换卷积层,继续执行转换步骤。在一些实施例中,从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层,包括:从目标卷积神经网络包括的至少一个卷积层中,按照预设的卷积层的层级数由大到小的顺序选择预定数目个卷积层作为待转换卷积层。在一些实施例中,从至少一个卷积层中的、未转换的卷积层中选择卷积层作为待转换卷积层,包括:从至少一个卷积层中的、未转换的卷积层中,按照预设的卷积层的层级数由大到小的顺序选择预定数目个卷积层作为待转换卷积层。在一些实施例中,确定转换后的卷积神经网络的识别精度,包括:利用机器学习方法,基于预设的训练样本对转换后的卷积神经网络进行训练,以及确定训练后的卷积神经网络的识别精度。在一些实施例中,基于转换后的卷积层,生成转换后的卷积神经网络,包括:确定转换后的卷积层的输入数据是否是目标卷积神经网络中的池化层的输出数据;响应于确定是,将池化层的输出数据转换为预设数目个通道,以及生成转换后的卷积神经网络。在一些实施例中,该方法还包括:响应于确定所确定的识别精度小于预设阈值,输出与识别精度相关的信息。第二方面,本申请实施例提供了一种用于存储卷积神经网络的装置,该装置包括:确定单元,配置用于从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层;转换单元,配置用于执行如下转换步骤:将待转换卷积层转换成深度可分离卷积结构,基于转换后的卷积层,生成转换后的卷积神经网络并存储;确定转换后的卷积神经网络的识别精度;选择单元,配置用于响应于确定所确定的识别精度大于等于预设阈值,从至少一个卷积层中的、未转换的卷积层中选择卷积层作为待转换卷积层,继续执行转换步骤。在一些实施例中,确定单元进一步配置用于:从目标卷积神经网络包括的至少一个卷积层中,按照预设的卷积层的层级数由大到小的顺序选择预定数目个卷积层作为待转换卷积层。在一些实施例中,选择单元进一步配置用于:从至少一个卷积层中的、未转换的卷积层中,按照预设的卷积层的层级数由大到小的顺序选择预定数目个卷积层作为待转换卷积层。在一些实施例中,转换单元进一步配置用于:利用机器学习方法,基于预设的训练样本对转换后的卷积神经网络进行训练,以及确定训练后的卷积神经网络的识别精度。在一些实施例中,转换单元,包括:确定模块,配置用于确定转换后的卷积层的输入数据是否是目标卷积神经网络中的池化层的输出数据;转换模块,配置用于响应于确定是,将池化层的输出数据转换为预设数目个通道,以及生成转换后的卷积神经网络。在一些实施例中,该装置还包括:输出单元,配置用于响应于确定所确定的识别精度小于预设阈值,输出与识别精度相关的信息。第三方面,本申请实施例提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的用于存储卷积神经网络的方法和装置,通过从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层;然后将待转换卷积层转换成深度可分离卷积结构,基于转换后的卷积层,生成转换后的卷积神经网络;随后通过确定转换后的卷积神经网络的识别精度,得到既满足识别精度又尽可能地减小占用的存储空间的卷积神经网络,从而实现了对卷积神经网络占用的存储空间的有效降低。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的用于存储卷积神经网络的方法的一个实施例的流程图;图3是根据本申请的用于存储卷积神经网络的方法的一个应用场景的示意图;图4是根据本申请的用于存储卷积神经网络的装置的一个实施例的结构示意图;图5是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于存储卷积神经网络的方法或用于存储卷积神经网络的装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用,例如图像处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。终端设备101、102、103可以是具有显示屏并且支持运行卷积神经网络的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。服务器105可以是提供各种服务的服务器,例如用于存储卷积神经网络的服务器。该服务器可以从终端设备或其他服务器获取待转换的经训练后的卷积神经网络,并对该卷积神经网络进行分析等处理,并对处理结果(例如经转换后的卷积神经网络)进行储存。需要说明的是,本申请实施例所提本文档来自技高网...

【技术保护点】
1.一种用于存储卷积神经网络的方法,包括:从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层;执行如下转换步骤:将待转换卷积层转换成深度可分离卷积结构,基于转换后的卷积层,生成转换后的卷积神经网络并存储;确定转换后的卷积神经网络的识别精度;响应于确定所确定的识别精度大于等于预设阈值,从所述至少一个卷积层中的、未转换的卷积层中选择卷积层作为待转换卷积层,继续执行所述转换步骤。

【技术特征摘要】
1.一种用于存储卷积神经网络的方法,包括:从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层;执行如下转换步骤:将待转换卷积层转换成深度可分离卷积结构,基于转换后的卷积层,生成转换后的卷积神经网络并存储;确定转换后的卷积神经网络的识别精度;响应于确定所确定的识别精度大于等于预设阈值,从所述至少一个卷积层中的、未转换的卷积层中选择卷积层作为待转换卷积层,继续执行所述转换步骤。2.根据权利要求1所述的方法,其中,所述从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层,包括:从目标卷积神经网络包括的至少一个卷积层中,按照预设的卷积层的层级数由大到小的顺序选择预定数目个卷积层作为待转换卷积层。3.根据权利要求2所述的方法,其中,所述从所述至少一个卷积层中的、未转换的卷积层中选择卷积层作为待转换卷积层,包括:从所述至少一个卷积层中的、未转换的卷积层中,按照预设的卷积层的层级数由大到小的顺序选择预定数目个卷积层作为待转换卷积层。4.根据权利要求1所述的方法,其中,所述确定转换后的卷积神经网络的识别精度,包括:利用机器学习方法,基于预设的训练样本对转换后的卷积神经网络进行训练,以及确定训练后的转换后的卷积神经网络的识别精度。5.根据权利要求1所述的方法,其中,所述基于转换后的卷积层,生成转换后的卷积神经网络,包括:确定转换后的卷积层的输入数据是否是所述目标卷积神经网络中的池化层的输出数据;响应于确定是,将池化层的输出数据转换为预设数目个通道,以及生成转换后的卷积神经网络。6.根据权利要求1-5之一所述的方法,其中,所述方法还包括:响应于确定所确定的识别精度小于预设阈值,输出与识别精度相关的信息。7.一种用于存储卷积神经网络的装置,包括:确定单元,配置用于从目标卷积神经网络包括的至少一个卷积层中确定待转换卷积层;转换单元,配置用于...

【专利技术属性】
技术研发人员:刘宇龙
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1