神经网络层训练方法、神经网络计算系统和计算机可读介质技术方案

技术编号：32349948 阅读：19 留言：0更新日期：2022-02-20 02:15

本发明专利技术提供一种神经网络的层训练方法，所述层包括以第一精度存储的一个或多个权重参数，所述训练方法包括：S101：为所述层提供输入；S102：选择精度低于所述第一精度的第二精度；S103：以所述第二精度量化所述一个或多个权重参数；S104：以第二精度的所述一个或多个权重参数，基于所述输入，计算所述层的输出；S105：通过反向传播算法，以第一精度更新所述一个或多个权重参数。本发明专利技术提出了任意精度神经网络的概念和实现。使得在部署的时候可以把同一个模型动态的量化到不同的精度级别下。对于需要的精度级别不需要额外维护对应的模型，同时在实际使用中，提供更丰富的精度级别选项，避免遇到无法满足需求的问题。避免遇到无法满足需求的问题。避免遇到无法满足需求的问题。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络层训练方法、神经网络计算系统和计算机可读介质

[0001]本专利技术大致涉及人工智能领域，尤其涉及神经网络层训练方法、精度可调节的神经网络计算系统和计算机可读介质。

技术介绍

[0002]神经网络对于算力有一定要求。给定一个已经训练完成的神经网络，在算力受限的情况下如果需要保证计算速度，则需要牺牲精度。实际应用中算力可能是可以动态调整的，例如手机在电量高的情况下可以提供高算力，电量低的时候则需要降低算力节约能耗。在这种情况下，需要一种模型能够动态的平衡算力和精度，满足实际应用需要。
[0003]现有技术方案需要维护多个不同的模型，在不同的运行精度下准备各个精度下的模型，在部署的时候根据需要替换模型，满足应用需求。如图1A-1C所示的，其中图1A示出了低精度的神经网络模型，其中计算的精度最低，例如为1bit；图1B示出了高精度的神经网络模型，其中计算的精度最高，例如为32bit；图1C示出了中间精度的神经网络模型，其中计算的精度居中，例如为n1bit，其中1<n1<32。根据需要，也可以预先存储准备更多数目的中间精度的神经网络模型。在进行计算时，图1A的低精度的神经网络模型所需的电力或算力最低，同时精度最差；图1B的高精度的神经网络模型所需的电力或算力最高，同时精度最高；图1C的中间精度的神经网络模型所需的电力或算力居中，同时精度居中。
[0004]现有技术主要问题是存储空间成本高，部署缺乏灵活性。在模型准备阶段必须明确应用中需要的不同精度级别，针对每一种进度级别，训...

【技术保护点】

【技术特征摘要】
1.一种神经网络的层训练方法，所述层包括以第一精度存储的一个或多个权重参数，所述训练方法包括：S101：为所述层提供输入；S102：选择精度低于所述第一精度的第二精度；S103：以所述第二精度量化所述一个或多个权重参数；S104：以第二精度的所述一个或多个权重参数，基于所述输入，计算所述层的输出；S105：通过反向传播算法，以第一精度更新所述一个或多个权重参数。2.如权利要求1或2所述的层训练方法，还包括：调整所述第二精度，重复所述步骤S101、S102、S103、S104和S105。3.如权利要求1或2所述的层训练方法，其中所述步骤S102包括：随机选择精度低于第一精度的第二精度。4.如权利要求1或2所述的层训练方法，还包括：以所述第一精度的所述一个或多个权重参数，基于所述输入，计算所述层的输出。5.如权利要求1或2所述的层训练方法，还包括：对所述神经网络的所有层，通过所述步骤S101、S102、S103、S104和S105来进行训练。6.一种精度可调节的神经网络计算系统，包括IO接口、存储器、量...

【专利技术属性】
技术研发人员：李皓翔，俞海超，华刚，
申请(专利权)人：虫极科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人