更新神经网络模型的方法和电子装置制造方法及图纸

技术编号：39824152 阅读：9 留言：0更新日期：2023-12-29 15:59

本发明专利技术公开一种更新神经网络模型的方法和电子装置

全部详细技术资料下载

【技术实现步骤摘要】
更新神经网络模型的方法和电子装置

[0001]本专利技术涉及一种人工智能技术，且特别涉及一种更新神经网络模型的方法和电子装置
。

技术介绍

[0002]目前，市面上已经出现能协助使用者自行开发客制化的神经网络模型的产品
。
然而，这些产品仅着重于利用启发式方法
(heuristic method)
产生具有较佳效能的神经网络模型，而忽略了如何有效降低神经网络模型的复杂度的问题
。
因此，产生的神经网络模型往往仅能在具有高运算力的装置上运作
。
在运算能力有限的情况下
(
例如：使用边缘运算装置运行人工智能模型
)
，神经网络模型可能无法顺利运算或神经网络模型的效能可能降低
。
[0003]然而，若利用传统的量化方法来量化神经网络模型以降低模型复杂度，则经量化的神经网络模型的效能可能会因逐层
(
例如：神经网络模型的卷积层
)
累积的量化误差而降低
。

技术实现思路

[0004]本专利技术提供一种更新神经网络模型的方法和电子装置，可通过对神经网络模型的神经元的权重进行量化以产生新神经元，可为神经网络模型进行模型降阶
(model order
‑
reduction)。
[0005]本专利技术的一种更新神经网络模型的电子装置，包含收发器以及处理器
。
收发器用以接收神经网络模型以及训练数据，其中神经网

【技术保护点】

【技术特征摘要】
1.
一种更新神经网络模型的电子装置，包括：收发器，用以接收该神经网络模型以及训练数据，其中该神经网络模型包括第一神经元以及与该第一神经元连接的第二神经元；以及处理器，耦接该收发器，其中该处理器经配置以执行：将该训练数据输入至该第一神经元以由该第二神经元输出第一预测值；量化该第一神经元的第一权重以产生第三神经元，并且量化该第二神经元的第二权重以产生与该第三神经元连接的第四神经元；将该训练数据输入至该第三神经元以由该第四神经元输出第二预测值；以及根据该第一预测值和该第二预测值更新该第一神经元的第一激励函数以及该第二神经元的第二激励函数，以产生经更新的该神经网络模型，其中，该收发器用以输出经更新的该神经网络模型
。2.
如权利要求1所述的电子装置，其中该处理器还经配置以执行：删除该第二预测值的位以产生经量化的该第二预测值；以及根据该第一预测值以及经量化的该第二预测值更新该第一激励函数以及该第二激励函数
。3.
如权利要求2所述的电子装置，其中该位包括最高有效位和最低有效位的至少其中之一
。4.
如权利要求1所述的电子装置，其中该处理器还经配置以执行：删除该第二预测值的位以产生经量化的该第二预测值；计算该第一预测值与经量化的该第二预测值之间的差值；以及响应于该差值小于阈值，利用该第四神经元的输出训练该第二神经元的下游神经元
。5.
如权利要求4所述的电子装置，其中该处理器还经配置以执行：响应于该差值大于或等于该阈值，利用该第二神经元的输出训练该下游神经元
。6.
如权利要求1所述的电子装置，其中该第一权重对应于第一浮点数格式，其中经量化的该第一权重对应于下列的其中之一：第二浮点数格式以及整数格式
。7.
如权利要求1所述的电子装置，其中该第一激励函数为分段函数
。8.
如权利要求1所述的电子装置，还包括：存储介质，耦接该处理器，用以存储该神经网络模型
。9.
如权利要求1所述的电子装置，还包括：存储介质，耦接该处理器，用以存储一叠代次数阈值，其中该处理器根据该叠代次数阈值决定是否停止更新该神经网络模型
。10.
一种更新神经网络模型的方法，用于具有收发器及处理器的电子装置，包括：通过该收发器接收该神经网络模型以及训练数据，其中该神...

【专利技术属性】
技术研发人员：林盈祯，李坤翰，
申请(专利权)人：纬创资通股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人