神经网络模型优化方法技术

技术编号：39712344 阅读：5 留言：0更新日期：2023-12-17 23:21

公开了神经网络模型优化方法

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型优化方法、装置及计算设备

[0001]本申请涉及人工智能领域，尤其涉及一种神经网络模型优化方法
、
装置及计算设备
。

技术介绍

[0002]人工智能
(Artificial Intelligence
，
AI)
是利用计算机模拟和扩展人的智能，感知环境
、
获取知识并使用知识获得结果的理论
、
方法
、
技术及应用系统
。
人工智能技术广泛应用于机器学习
(Machine Learning
，
ML)、
自然语言处理
、
计算机视觉
、
决策与推理
、
人机交互
、
推荐与搜索和
AI
基础理论等领域
。
基于神经网络模型处理数据实现识别等应用功能是人工智能应用的关键技术
。
[0003]通常，云侧设备可以采用训练集对神经网络模型进行训练，使神经网络模型具备识别等应用功能，并将神经网络模型部署到至少一个终端
(
如：智能手机
、
摄像头
、
自动驾驶汽车等
)。
终端利用配置的神经网络模型对获取到的应用数据
(
如：图像
、
语音等
)
进行处理实现识别等应用功能
。
为了提高神经网络模型处理数据的精度，神经网络模型逐...

【技术保护点】

【技术特征摘要】
1.
一种神经网络模型优化方法，其特征在于，所述方法由计算设备执行，所述方法包括：获取待优化的神经网络模型，所述神经网络模型包含多个可量化算子，所述多个可量化算子在所述神经网络模型中被顺次执行；确定所述多个可量化算子中的第一可量化算子在运行所述神经网络模型的硬件平台上运行时的算子耗时；获取所述神经网络模型在所述硬件平台上上一次运行后的性能参数；根据所述算子耗时
、
所述性能参数及所述多个可量化算子中的第二可量化算子的算子参数确定所述第二可量化算子的量化位宽，所述第一可量化算子为所述第二可量化算子的前一个可量化算子；在依次确定所述多个可量化算子的量化位宽后，根据所确定的所述多个可量化算子中每个可量化算子的量化位宽在所述硬件平台上执行神经网络模型，并在所述神经网络模型的输出的性能参数达到目标性能参数时，完成对所述神经网络模型的优化
。2.
根据权利要求1所述的方法，其特征在于，在所述根据所确定的每个可量化算子的量化位宽在所述硬件平台上执行神经网络模型后，在所述神经网络模型的输出的性能参数没有达到所述目标性能参数时，则继续确定所述神经网络模型中所述每个可量化算子的量化位宽，并根据所确定的所述多个可量化算子的量化位宽在所述硬件平台上执行神经网络模型，直到所述神经网络模型的输出的性能参数达到所述目标性能参数
。3.
根据权利要求1所述的方法，其特征在于，确定所述多个可量化算子中的第一可量化算子在运行所述网络模型的硬件平台上运行时的算子耗时包括：在等价算子库中确认所述第一可量化算子对应的第一算子集是否存在等价算子集；当存在所述等价算子集时，则在所述硬件平台上分别运行所述第一算子集及所述等价算子集，确定第一算子集耗时及等价算子集耗时，当所述第一算子集耗时小于等于所述等价算子集耗时时，将所述第一算子集耗时作为所述算子耗时，当所述第一算子集耗时大于所述等价算子集耗时时，将所述等价算子集耗时作为所述算子耗时
。4.
根据权利要求3所述的方法，其特征在于，所述方法还包括：当所述第一算子集耗时大于所述等价算子集耗时时，在根据所确定的所述多个算子的量化位宽在所述硬件平台上执行神经网络模型时，用所述等价算子集替换所述第一算子集
。5.
根据权利要求1至4中任意一项所述的方法，其特征在于，所述性能参数包括所述神经网络模型的精度
、
时延和模型大小中的至少一个
。6.
一种神经网络模型优化装置，其特征在于，所述装置由计算设备执行，所述装置包括：通信模块，用于获取待优化的神经网络模型，所述神经网络模型包含多个可量化算子...

【专利技术属性】
技术研发人员：孙允允，赖坤锋，宁振江，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人