模型数据处理方法技术

技术编号:39492721 阅读:18 留言:0更新日期:2023-11-24 11:18
本申请公开了一种模型数据处理方法

【技术实现步骤摘要】
模型数据处理方法、装置、设备和介质
5

[0001]本公开一般涉及计算机领域,具体涉及一种模型数据处理方法

装置

设备和介质


技术介绍

[0002]随着人工智能的发展,神经网络模型被广泛应用于各种领域

相关技术中,通常根据模型的需求构造学术性的模型,并通过训练使得模型达到预期的精度,然后将训练好的模型部署到更低功耗的设备上,实现工业部署

在具体应用中,为了使得训练好的模型能够更好地部署在低功耗设备上,通常对模型进行裁剪压缩以降低模型的大小和减少推理延迟

[0003]现有的压缩工具虽然能够实现降低模型大小的目的,但是由于其对无压缩参数的网络层进行参数计算时,通常是通过保存各网络层运算后中间值,例如卷积层的卷积结果,再根据中间值推算压缩参数,使得整个压缩过程会占用大量的内存,影响整个压缩效率


技术实现思路

[0004][0005]鉴于现有技术中的上述缺陷或不足,期望提供一种模型数据处理方法r/>、
装本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种模型数据处理方法,其特征在于,包括:获取待处理模型的模型数据,所述模型数据用于表征所述待处理模型包括的至少两个网络层以及所述至少两个网络层之间的执行逻辑,所述网络层用于对输入至待处理模型的数据进行处理;获取所述至少两个网络层中第一网络层的压缩参数,根据所述第一网络层的压缩参数确定除所述第一网络层外的每一所述网络层的压缩参数;所述压缩参数用于指示所述网络层中待删除的网络模块;基于每一所述网络层的压缩参数对所述模型数据进行压缩处理,获得所述待处理模型的压缩结果
。2.
根据权利要求1所述的方法,其特征在于,所述获取所述至少两个网络层中第一网络层的压缩参数,包括:获取所述第一网络层的初始压缩参数,确定所述第一网络层基于所述初始压缩参数得到的压缩网络结构;确定所述压缩网络结构与所述待处理模型的其他网络层之间是否存在冲突,所述冲突包括所述压缩网络结构与所述其他网络层之间的逻辑冲突,或,所述压缩网络结构与预设逻辑之间的冲突;若所述压缩网络结构与所述待处理模型的其他网络层之间存在冲突,则对所述第一网络层的初始压缩参数进行修正,直至所述压缩网络结构与所述待处理模型的其他网络层之间不存在冲突,获得所述第一网络层的压缩参数
。3.
根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述第一网络层的压缩参数确定目标网络层的压缩参数;所述目标网络层包括所述第一网络层基于所述压缩参数得到的目标压缩网络结构,或,所述压缩网络结构执行预设逻辑后获得的网络结构
。4.
根据权利要求3所述的方法,其特征在于,所述方法还包括:根据所述目标网络层的压缩参数对与所述目标网络层存在执行逻辑的其他网络层的压缩参数进行修正
。5.
根据权利要求2‑4中任一所述的方法,其特征在于,所述获取所述第一网络层的初始压缩参数,包括:获取压缩策略,基于所述压缩策略对所述第一网络层的模型文件进行运算,确定所述第一网络层的初始压缩参数
。6.
根据权利要求2所述的方法,其特征在于,在所述冲突为所述压缩网络结构执行预设逻辑后获得的网络结构与所述待处理模型的其他网络层之间的逻辑冲突时,所述预设逻辑包括拆分逻辑,所述对所述第一网络层的初始压缩参数进行修正,包括:基于所述拆分逻辑和所述压缩网络结构,确定所述压缩网络结构执行所述拆分逻辑后获得的拆分结果,所述拆分结果用于表征所述压缩网络结构拆分后的至少两个网络结构以及每个所述网络结构的初始压缩参数;确定至少两个网络结构对应的初始压缩参数中的最小值,所述最小值用于表征至少两个所述网络结构中待删除的网络模块的最小数量;
基于所述最小值对所述第一网络层的初始压缩参数进行修正,得到所述第一网络层的压缩参数
。7.
根据权利要求6所述的方法,其特征在于,所述基于所述最小值对所述第一网络层的初始压缩参数进行修正,得到所述第一网络层的压缩参数,包括:基于所述最小值对至少两个所述网络结构对应的初始压缩参数进行修正,得到至少两个所述网络结构的压缩参数;将至少两个所述网络结构的压缩参数进行拼接,得到所述第一网络层的压缩参数
。8.
根据权利要求2所述的方法,其特征在于,在所述冲突为所述压缩网络结构...

【专利技术属性】
技术研发人员:程雅慧
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1