用于神经网络的数据量化方法、装置、计算机设备及介质制造方法及图纸

技术编号：42199212 阅读：24 留言：0更新日期：2024-07-30 18:46

本发明专利技术涉及人工智能技术领域，尤其涉及一种用于神经网络的数据量化方法、装置、计算机设备及介质。该方法将网络参数向量和初始区间系数拼接为当前状态向量，以当前状态向量为条件，预测量化区间系数的取值，根据得到的预测区间系数，确定当前量化区间，以当前状态向量和当前量化区间为条件，预测当前量化区间的量化粒度系数，根据得到的预测粒度系数和当前量化区间，计算出当前量化粒度，根据当前量化粒度更新模型参数，将预测区间系数作为初始区间系数，迭代直至收敛，根据收敛时对应的当前量化区间和当前量化粒度，对输入数据进行量化处理，在尽量减少神经网络精度下降的前提下，提高数据量化的细粒度，进而提高了数字医疗平台的服务高效化。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，尤其涉及一种用于神经网络的数据量化方法、装置、计算机设备及介质。

技术介绍

1、随着人工智能技术的兴起，基于神经网络的人工智能模型已广泛应用于数字医疗平台中，数字医疗平台可以支持疾病辅助诊断、健康管理、远程会诊等功能，从而提高医疗机构的效率，方便居民就医。

2、由于神经网络的计算量较大，因此出现了专用于加速神经网络计算的芯片，通常称之为神经网络加速器，但是，在数字医疗平台内，随着医疗数据量的逐渐增大，神经网络的规模也越来越大，导致神经网络消耗的内存过大而无法部署到加速器上。

3、因此，现有方法通常是采用数据量化的方式来降低神经网络的内存消耗，但是，数据量化会导致神经网络精度的下降，这一缺点在神经网络层数较深时表现得尤为明显，而且，现有将数据量化为固定数据类型的方式，例如16位浮点数、8位整型等，所带来的内存消耗降低较为有限，难以满足日益增长的内存需求。因此，如何在尽量减少神经网络精度下降的前提下，提高数据量化的细粒度成为亟待解决的问题。

技术实现思路p>

1、有鉴于本文档来自技高网...

【技术保护点】

1.一种用于神经网络的数据量化方法，其特征在于，所述数据量化方法包括：

2.根据权利要求1所述的数据量化方法，其特征在于，所述将获取的所述目标网络层的网络参数向量和所述初始区间系数拼接，得到拼接结果，包括：

3.根据权利要求1所述的数据量化方法，其特征在于，所述将获取的目标网络层的网络参数向量和初始区间系数拼接，得到拼接结果，包括：

4.根据权利要求1所述的数据量化方法，其特征在于，所述以所述当前状态向量为条件，使用区间系数预测模型对量化区间系数的取值进行预测，得到预测区间系数，包括：

5.根据权利要求1所述的数据量化方法，其特征在于，所述...

【技术特征摘要】

1.一种用于神经网络的数据量化方法，其特征在于，所述数据量化方法包括：

2.根据权利要求1所述的数据量化方法，其特征在于，所述将获取的所述目标网络层的网络参数向量和所述初始区间系数拼接，得到拼接结果，包括：

3.根据权利要求1所述的数据量化方法，其特征在于，所述将获取的目标网络层的网络参数向量和初始区间系数拼接，得到拼接结果，包括：

5.根据权利要求1所述的数据量化方法，其特征在于，所述根据所述预测区间系数、预设的区间最大边界值和区间最小边界值，计算得到更新最大边界值和更新最小边界值，包括：

6.根据权...

【专利技术属性】
技术研发人员：李佳琳，瞿晓阳，陶伟，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人