【技术实现步骤摘要】
一种数据处理方法、装置、设备以及存储介质
[0001]本公开涉及人工智能
,尤其涉及深度学习
,可适用于语音识别、自然语言处理和信息推荐等场景。
技术介绍
[0002]随着人工智能技术的发展,深度学习技术在日常生活中的应用越来越广,为了不断提升深度学习模型的模型精度,导致模型的复杂度和参数量都在持续增加,直接影响模型体积和模型的运算速度,从而影响人工智能技术落地成本,亟需改进。
技术实现思路
[0003]本公开提供了一种数据处理方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种数据处理方法,包括:
[0005]获取目标量化网络层输入的特征矩阵和目标量化网络层的权重矩阵;其中,特征矩阵的列数等于权重矩阵的行数;
[0006]根据目标量化网络层的目标分段系数,将特征矩阵的每一行特征元素划分为至少两个特征元素子段,以及将权重矩阵的每一列权重元素划分为至少两个权重元素子段;
[0007]根据目标量化网络层的目标量化比特数,对至少两个特征元素子段和至少两个权重元素子段进行量化处理,并根据量化处理结果,确定目标量化网络层的输出特征。
[0008]根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
[0009]至少一个处理器;以及
[0010]与至少一个处理器通信连接的存储器;其中,
[0011]存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开任一实施例的数
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:获取目标量化网络层输入的特征矩阵和所述目标量化网络层的权重矩阵;其中,所述特征矩阵的列数等于所述权重矩阵的行数;根据所述目标量化网络层的目标分段系数,将所述特征矩阵的每一行特征元素划分为至少两个特征元素子段,以及将所述权重矩阵的每一列权重元素划分为至少两个权重元素子段;根据所述目标量化网络层的目标量化比特数,对所述至少两个特征元素子段和所述至少两个权重元素子段进行量化处理,并根据量化处理结果,确定所述目标量化网络层的输出特征。2.根据权利要求1所述的方法,其中,所述根据所述目标量化网络层的目标分段系数,将所述特征矩阵的每一行特征元素划分为至少两个特征元素子段,以及将所述权重矩阵的每一列权重元素划分为至少两个权重元素子段,包括:根据所述目标量化网络层的目标分段系数中的第一系数,将所述特征矩阵的每一行特征元素划分为至少两个特征元素子段;根据所述目标分段系数中的第二系数,将所述权重矩阵的每一列权重元素划分为至少两个权重元素子段;其中,所述第一系数和所述第二系数成整数倍关系。3.根据权利要求1所述的方法,其中,所述根据量化处理结果,确定所述目标量化网络层的输出特征,包括:确定所述特征矩阵中的每一特征元素子段,在所述权重矩阵中对应的权重元素子段,并将具有对应关系的特征元素子段和权重元素子段作为一组关联子段对;根据每组关联子段对中的特征元素子段和权重元素子段的量化处理结果,确定所述目标量化网络层的输出特征。4.根据权利要求3所述的方法,其中,所述每组关联子段对中包含的特征元素子段和权重元素子段的数量比值,与划分所述权重矩阵和所述特征矩阵的分段系数的比值相同。5.根据权利要求1
‑
4中任一项所述的方法,其中,所述根据量化处理结果,确定所述目标量化网络层的输出特征,包括:通过图形处理器GPU的张量核Tensor Core计算单元,根据量化处理结果,确定所述目标量化网络层的输出特征。6.根据权利要求1
‑
5中任一项所述的方法,其中,所述特征矩阵是语音片段经特征提取层处理后得到的语音特征;所述输出特征用于对所述语音片段进行语义识别处理。7.根据权利要求1
‑
6中任一项所述的方法,还包括:确定原始模型的可选量化策略;其中,所述可选量化策略包括:可选量化网络层、所述可选量化网络层的可选分段系数和可选量化比特数;获取所述原始模型基于所述可选量化策略执行数据处理,得到的所述可选量化策略的量化贡献信息;根据所述量化贡献信息,从所述可选量化策略中确定目标量化策略,以得到所述目标量化网络层、所述目标量化网络层的目标分段系数和目标量化比特数。8.根据权利要求7所述的方法,其中,所述根据所述量化贡献信息,从可选量化策略中
确定目标量化策略,包括:根据所述可选量化策略对应的量化贡献信息,从所述可选量化策略中确定新增选定量化策略;确定所述新增选定策略和历史选定量化策略的总压缩体积;在所述总压缩体积达到量化要求的情况下,将所述新增选定量化策略和所述历史选定量化策略作为目标量化策略。9.根据权利要求8所述的方法,其中,所述量化贡献信息包括模型精度信息和压缩体积信息;所述根据所述可选量化策略对应的量化贡献信息,从所述可选量化策略中确定新增选定量化策略,包括:根据所述可选量化策略对应的所述模型精度信息和压缩体积信息,对所述可选量化策略进行排序;根据排序结果和所述可选量化策略对应的压缩体积信息,从所述可选量化策略中确定新增选定量化策略。10.根据权利要求8或9所述的方法,还包括:在所述总压缩体积未达到量化要求的情况下,基于所述新增选定量化策略对所述原始模型进行初步量化,并训练初步量化后的原始模型,得到初步量化模型;将所述新增选定量化策略添加到所述历史选定量化策略;将所述可选量化策略中除所述新增选定量化策略之外的其他可选量化策略作为新的可选量化策略,并将所述初步量化模型作为所述原始模型,返回执行获取所述原始模型基于所述可选量化策略执行数据处理,得到的所述可选量化策略的量化贡献信息的操作。11.一种数据处理装置,包括:矩阵获取模块,用于获取目标量化网络层输入的特征矩阵和所述目标量化网络层的权重矩阵;其中,所述特征矩阵的列数等于所述权重矩阵的行数;矩阵分段模块,用于根据所述目标量化网络层的目标分段系数,将所述特征矩阵的每一行特征元素划分为至少两个特征元素子段,以及将所述权重矩阵的每一列权重元素划分为至少两个权重元素子段;量化...
【专利技术属性】
技术研发人员:王桂彬,丛士钧,贾铭,贾磊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。