嵌入式设备的多输入神经网络模型串行块的存储方法技术

技术编号：37628802 阅读：11 留言：0更新日期：2023-05-18 12:20

本发明专利技术公开了嵌入式设备的多输入神经网络模型串行块的存储方法。本发明专利技术方法提出了一种多输入神经网络模型结构，该结构要求神经网络模型按照数据更新频率的不同分为多个串行块，每个串行块包含一层或多层神经网络。通过遍历所有存储情况，并进行多输入神经网络模型的运行，测量和记录每种存储情况的功耗和运行时间数据，选取功耗最低，并满足运行时间要求的存储方案，作为最终串行块部署方案。本发明专利技术通过对网络模型结构的优化，以及对应此结构的部署优化，降低该神经网络部署在端侧嵌入式设备上的算力需求，运行功耗要求。从而使得嵌入式设备可以部署更大规模的多输入神经网络模型，以提升模型的可配置性和泛化能力。以提升模型的可配置性和泛化能力。以提升模型的可配置性和泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
嵌入式设备的多输入神经网络模型串行块的存储方法

[0001]本专利技术属于嵌入式设备
，具体地说是一种嵌入式设备的多输入神经网络模型串行块的存储方法。

技术介绍

[0002]神经网络模型已经被广泛应用于计算机视觉、自然语言处理等领域。随着技术的不断发展，人们对神经网络模型的期望越来越高。然而，由于神经网络模型需要大量的计算资源和存储空间，这使得在嵌入式设备上部署神经网络模型成为一个具有挑战性的问题。端侧嵌入式设备对神经网络有实时要求，功耗要求，算力要求，可配置性要求，隐私保护要求，这使得神经网络模型的部署变得更加复杂。对端侧神经网络模型部署的相关需求和常见解决手段主要如下：可配置性要求：这个需求是神经网络落地实际产品时都会遇到的需求。这个需求主要出现在方案调试阶段以及客户使用阶段。在方案调试阶段，方案调试人员在推广客户时，灵活可配对于方案的快速落地会有非常大的帮助。由于网络模型是轻量级的，一般轻量级网络由于泛化能力的不足，并不能支持较多的配置项，以改变效果。常用的做法是训练很多个轻量级模型，这在选项较少的情况下可行，如果选项较多时，模型个数将会随着选项的个数成指数次上升，这对于训练模型海还是部署模型都是不可接受的。比如每个选项分2档进行训练，那么10个选项，排列组合将达到2的10次方个模型。在客户使用阶段，也有些个性化的选项需要调节，比如图像的清晰程度，降噪的强度等，端侧设备存储空间有限，无法存放过多的模型。
[0003]隐私保护要求：用户的图像，声音等都是隐私信息，在用户隐私越来越重视的今天很多产品都...

【技术保护点】

【技术特征摘要】
1.嵌入式设备的多输入神经网络模型串行块的存储方法，其特征在于：所述的嵌入式设备包含输入单元、神经网络计算单元、输出单元、中央处理器和存储器；所述的神经网络计算单元通过对多输入神经网络模型进行推理计算，处理输入单元所获取的数据；所述的多输入神经网络模型包含多个输入数据接口，并且输入的数据之间具有多个更新频率差异；所述的多输入神经网络模型的结构按输入数据更新频率的不同，由低到高分为N个串行块，N≥2，数据更新频率相同的结构作为一个串行块；每个串行块包含一层或多层神经网络，串行块存储多输入神经网络模型该块的参数和数据；第一串行块K1接收更新频率最低的数据输入，第一串行块K2接收更新频率次低的数据输入和第一串行块K1的输出，以此类推，第N串行块K
N
接收更新频率最高的数据输入和第N
‑
1串行块K
N
‑1的输出；如果更新频率相同，则作为同一个块的输入；所述多输入神经网络模型采用有监督训练，并采用BP算法进行优化，不同串行块之间均为可导；具体存储方案确定方法如下：将多个存储器按照访问速度从慢到快进行排序，C1,
…
,C
M
，M为存储器数量；将N个串行块的参数和数据以串行块为单位存储到M个存储器中，更新频率低的串行块的参数和数据存储到访问速度慢的存储器,如果第n个串行块K
n
的参数和数据存储到第m个存储器C
m
中，则第n+1个串行块K
n+1
的参数和数据存储到第m个存储器C
m
或第m+1个存储器C
m+1
中；运行所述的多输入神经网络模型，如果某个串行块K
n
的输入需要更新，则中央处理器调度神经网络计算单元，对该串行块K
n
进行计算，得到该串行块K
n
输出，作为第n+...

【专利技术属性】
技术研发人员：钟宇清，凌云，杨常星，宋蕴，宋一平，黄磊，应屹航，
申请(专利权)人：杭州国芯科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人