【技术实现步骤摘要】
一种模型量化处理系统及一种模型量化处理方法
[0001]本申请涉及机器学习
,特别涉及一种模型量化处理系统及一种模型量化处理方法。
技术介绍
[0002]随着人工智能和机器学习领域的蓬勃发展,关于神经网络的研究已经成为最大的热点。CNN(卷积神经网络)是机器学习中最重要的算法之一,目前已经广泛应用于图像分类、目标检测、人脸识别、自动驾驶等众多领域,并取得了很好的实际效果。
[0003]目前网络推理过程大多会采用模型量化来加速神经网络计算。通过量化可以减少激活和权重存储的空间需求,还能降低计算复杂度、加快计算速度,进一步降低功耗,进而使得神经网络在硬件上的部署更加容易。现有技术中,需要为不同的量化方法订制对应的模型量化方案,流程较为复杂。
[0004]因此,如何适应不同种类量化方法对应的量化参数的存储与更新,提高模型量化操作的效率是本领域技术人员目前需要解决的技术问题。
技术实现思路
[0005]本申请的目的是提供一种模型量化处理系统及一种模型量化处理方法,能够适应不同种类量化方法对应的量 ...
【技术保护点】
【技术特征摘要】
1.一种模型量化处理系统,其特征在于,包括:BIAS参数存储器,用于存储神经网络模型的BIAS参数,并利用BIAS参数FIFO存储器将所述BIAS参数传输至卷积计算模块;其中,所述BIAS参数存储器为BRAM类型的存储器;移位参数存储器,用于存储所述神经网络模型的移位参数,并利用移位参数FIFO存储器将所述移位参数传输至所述卷积计算模块;其中,所述移位参数存储器为BRAM类型的存储器;零点参数存储器,用于存储所述神经网络模型的零点参数,并利用零点参数FIFO存储器将所述零点参数传输至所述卷积计算模块;其中,所述零点参数存储器为BRAM类型的存储器;所述卷积计算模块,用于对所述BIAS参数、所述移位参数和所述零点参数进行量化计算并根据计算结果对所述神经网络模型进行模型量化处理。2.根据权利要求1所述模型量化处理系统,其特征在于,还包括:第一读BRAM控制模块,用于根据所述卷积计算模块的反馈生成第一读使能信号和第一读地址,并将所述第一读使能信号和所述第一读地址输出至所述BIAS参数存储器,以便所述BIAS参数存储器根据所述第一读使能信号和所述第一读地址读取对应的BIAS参数。3.根据权利要求1所述模型量化处理系统,其特征在于,还包括:第一读FIFO控制模块,用于根据所述卷积计算模块的反馈生成第一读使能信号,并将所述第一读使能信号输出至所述BIAS参数FIFO存储器,以使所述BIAS参数FIFO存储器根据所述第一读使能信号读取对应的BIAS参数。4.根据权利要求1所述模型量化处理系统,其特征在于,还包括:第二读BRAM控制模块,用于根据所述卷积计算模块的反馈生成第二读使能信号和第二读地址,并将所述第二读使能信号和所述第二读地址输出至所述移位参数存储器,以便所述移位参数存储器根据所述第二读使能信号和所述第二读地址读取对应的移位参数。5.根据权利要求1所述模型量化处理系统,其特征在于,还包括:第二读FIFO控制模块,用于根据所述卷积计算模块的反馈生成第二读使能信号,并将所述第二读使能信号输出至所述移位参数FIFO存储器,以使所述移位参数FIFO存储器根据所述第二读使能信号读取对应的移位参数。6.根据权利要求1所述模型量化...
【专利技术属性】
技术研发人员:刘海威,鲁璐,梁玲燕,董刚,杨宏斌,赵雅倩,
申请(专利权)人:浪潮北京电子信息产业有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。