一种数据处理方法及相关产品技术

技术编号：25600610 阅读：32 留言：0更新日期：2020-09-11 23:57

本技术方案涉及一种数据处理方法及相关产品，所述产品中的板卡包括：存储器件、接口装置和控制器件以及人工智能芯片；其中，所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；所述存储器件，用于存储数据；所述接口装置，用于实现所述人工智能芯片与外部设备之间的数据传输；所述控制器件，用于对所述人工智能芯片的状态进行监控。所述板卡可以用于执行人工智能运算。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及相关产品
本公开的实施例涉及一种数据处理方法及相关产品。
技术介绍
神经网络(neuralnetwork，NN)是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络通过样本数据的训练，不断修正网络权值和阈值使误差函数沿负梯度方向下降，逼近期望输出。它是一种应用较为广泛的识别分类模型，多用于函数逼近、模型识别分类、数据压缩和时间序列预测等。在实际运用中，神经网络的数据常用32Bit，现有的神经网络的数据占用的比特位较多，虽然确保了精度，但是需要较高的存储空间以及处理带宽，提高了成本。
技术实现思路
为了解决上述所述的技术问题，本公开提出一种数据处理方法及相关产品。为实现上述目的，本公开提供一种数据处理方法，包括：所述通用处理器获取端侧人工智能处理器的硬件架构信息，根据所述端侧人工智能处理器的硬件架构信息生成对应的二进制指令；所述通用处理器根据所述二进制指令生成对应的训练任务，将所述训练任务发送至云侧人工智能处理器上运行；所述云侧人工智能处理器接收所述训练任务，执行所述训练任务，获得训练结果；所述通用处理器接收所述训练任务对应的训练结果，根据所述训练结果确定对应的超参数；其中，所述超参数是用于确定在训练过程中目标迭代间隔；所述目标迭代间隔包括至少一次权值更新迭代，且同一目标迭代间隔内量化过程中采用相同的所述数据位宽；所述通用处理器根据同一端侧人工智能处理器的硬件架构信息的不同训练结果对应的超参数确定超参数映射表；其中...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：/n通用处理器读取超参数映射表；其中，所述超参数映射表是不同的神经网络模型与超参数之间的对应关系；/n所述通用处理器根据所述神经网络模型从所述超参数映射表中确定对应的超参数；其中，所述超参数是用于确定在训练过程中目标迭代间隔；所述目标迭代间隔包括至少一次权值更新迭代，且同一目标迭代间隔内量化过程中采用相同的所述数据位宽；/n所述通用处理器根据所述端侧人工智能处理器的硬件架构信息和所述超参数生成对应的二进制指令；/n所述通用处理器根据所述二进制指令生成对应的训练任务，将所述训练任务发送至云侧人工智能处理器上运行。/n

【技术特征摘要】
20190612 CN 2019105052397;20190614 CN 2019105153551.一种数据处理方法，其特征在于，包括：
通用处理器读取超参数映射表；其中，所述超参数映射表是不同的神经网络模型与超参数之间的对应关系；
所述通用处理器根据所述神经网络模型从所述超参数映射表中确定对应的超参数；其中，所述超参数是用于确定在训练过程中目标迭代间隔；所述目标迭代间隔包括至少一次权值更新迭代，且同一目标迭代间隔内量化过程中采用相同的所述数据位宽；
所述通用处理器根据所述端侧人工智能处理器的硬件架构信息和所述超参数生成对应的二进制指令；
所述通用处理器根据所述二进制指令生成对应的训练任务，将所述训练任务发送至云侧人工智能处理器上运行。

2.如权利要求1所述的数据处理方法，其特征在于，所述超参数映射表的获得步骤包括：
所述通用处理器获取端侧人工智能处理器的硬件架构信息，根据所述端侧人工智能处理器的硬件架构信息生成对应的二进制指令；
所述通用处理器根据所述二进制指令生成对应的训练任务，将所述训练任务发送至云侧人工智能处理器上运行；
所述云侧人工智能处理器接收所述训练任务，执行所述训练任务，获得训练结果；
所述通用处理器接收所述训练任务对应的训练结果，根据所述训练结果确定对应的超参数；其中，所述超参数是用于确定在训练过程中目标迭代间隔；所述目标迭代间隔包括至少一次权值更新迭代，且同一目标迭代间隔内量化过程中采用相同的所述数据位宽；
所述通用处理器根据同一端侧人工智能处理器的硬件架构信息的不同训练结果对应的超参数确定超参数映射表；其中，所述超参数映射表是不同的神经网络模型与超参数之间的对应关系。

3.如权利要求2所述的方法，其特征在于，所述训练任务包括：
统计待量化数据，确定每种待量化数据的统计结果；其中，所述待量化数据包括所述神经网络的神经元、权值、梯度、偏置中的至少一种数据；
利用每种待量化数据的统计结果以及数据位宽确定对应量化参数；
利用所述量化参数对所述待量化数据进行量化，获得对应的定点型数据；
利用所述定点型数据进行训练。

4.如权利要求3所述的方法，其特征在于，所述统计结果为每种待量化数据中的最大值和最小值；
或所述统计结果为每种待量化数据中的绝对值最大值；
或所述绝对值最大值根据每种待量化数据中的最大值和最小值确定。

5.如权利要求3所述的方法，其特征在于，所述量化参数根据每种待量化数据中的最大值、最小值以及所述数据位宽确定；
或所述量化参数根据每种待量化数据中的绝对值最大值、所述数据位宽确定；
或所述量化参数为点位置参数或第一缩放系数；
或所述量化参数包括点位置参数和第二缩放系数。

6.如权利要求5所述的方法，其特征在于，所述第一缩放系数根据点位置参数和第二缩放系数确定；其中，确定第一缩放系数时使用的点位置参数为已知固定值，或所述点位置参数和对应的所述第二缩放系数相乘的结果整体作为第一缩放系数应用于神经网络运算过程中的数据量化。

7.如权利要求5所述的方法，其特征在于，所述第二缩放系数根据所述点位置参数、所述统计结果、所述数据位宽确定。

8.如权利要求5～6任一项权利要求所述的方法，其特征在于，所述量化参数还包括偏移量；其中，所述偏移量根据每种待量化数据的统计结果确定。

9.如权利要求3所述的方法，其特征在于，所述数据位宽是预设值；或所述数据位宽根据对应的量化误差进行调整；其中，所述量化误差是根据量化后的数据与对应的量化前的数据确定。

10.如权利要求9所述的方法，其特征在于，所述数据位宽的调整步骤包括：
所述量化误差与阈值进行比较，根据比较结果，调整所述数据位宽；其中，所述阈值包括第一阈值和第二阈值中的至少一个。

11.如权利要求10所述的方法，其特征在于，调整所述数据位宽的步骤包括：
所述量化误差大于等于所述第一阈值，则对所述数据位宽进行增加；或
所述量化误差小于等于所述第二阈值，则对所述数据位宽进行减少；或
所述量化误差处于所述第一阈值和所述第二阈值之间，则所述数据位宽保持不变。

12.如权利要求9所述的方法，其特征在于，所述量化误差的获取方法包括：
根据所述数据位宽确定量化间隔；
根据所述量化间隔、所述量化后的数据的个数与对应的量化前的数据确定量化误差；或
对量化后的数据进行反量化，获得反量化数据；其中，所述反量化数据的数据格式与对应的量化前的数据的数据格式相同；
根据所述量化后的数据以及对应的反量化数据确定量化误差。

13.如权利要求9所述的方法，其特征在于，所述量化前的数据是所述待量化数据；或所述量化前的数据...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人