一种神经网络终端部署微调训练方法技术

技术编号：24578010 阅读：83 留言：0更新日期：2020-06-21 00:39

本发明专利技术公开了一种神经网络终端部署微调训练方法。本发明专利技术方法具体步骤是：S0生成原始模型；S1生成原始推断模型；S2编译优化；S3部署模型运行测试集；S4测试准确率是否达到目标，若未达到则执行S5；S5部署模型运行训练集；S6原模型进行训练，结果用部署模型结果替代；S7生成新模型，执行步骤S2。本发明专利技术方法修改简单可以降低开发神经网络部署准确率微调训练工程的难度和工作量，并且通用性好，对于各种编译优化导致的推断误差都可以进行训练从而提高部署模型的准确率。

A fine tuning training method for terminal deployment of neural network

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络终端部署微调训练方法
本专利技术属于计算机
，尤其是神经网络训练
，具体涉及一种神经网络终端部署微调训练方法，具体是神经网络在设备端部署微调准确率的训练方法。
技术介绍
近些年来随着神经网络算法的发展，其准确率在诸多领域已经大幅超过传统算法。但是由于神经网络算法对部署系统的算力以及带宽有非常高的要求。因此神经网络算法的运行功耗也会较高。在部署到设备端时一般需要进行大幅度的优化，以此降低神经网络算法在部署时对算力，带宽和功耗的消耗。常见的优化包括量化，剪枝，压缩，算子合并，激活函数拟合，动态数据剪枝等。这些优化手段中比如量化，剪枝，激活函数拟合，动态数据剪枝等都是对神经网络计算精度有损的方法。但这对于需要高准确率，高精度场合就较难直接采用这些优化手段。通过微调重训练提升部署模型的准确率的方法，与部署设备神经网络算子实现方式紧密相关。举例而言，如果部署设备支持的激活函数的实现方式和训练平台中的实现方式有差异从而导致最终结果准确率下降，那么就需要在对这种情况进行微调训练。由于这种微调训练的实现由于涉及硬件实现的细节，一般需要有设备设计者提供训练工具。但这种训练工具的设计有几个设计难点：一、现在算法设计人员所采用的神经网络训练平台种类繁多。比如Tensorflow，Pytorch，Keras，Mxnet等。设备提供商需要设计不同的平台的微调部署工具。对平台底层代码改动较多的话还很可能会涉及到各训练平台不同版本的兼容性问题。这会带来巨大的工作量和维护成本。二、需要修改的算子类型较...

【技术保护点】
1.一种神经网络终端部署微调训练方法，其特征在于，该方法具体是：/nS0.神经网络训练平台生成原始高精度神经网络训练模型；/nS1.去除原始高精度神经网络训练模型中推断无关算子，生成原始高精度神经网络推断模型；/nS2.编译生成部署神经网络模型；其第一次运行载入的模型为原始高精度神经网络推断模型，之后运行载入的模型为步骤S7生成的新高精度神经网络推断模型；/nS3.在部署平台上运行部署神经网络模型，计算结果的准确率，其输入为测试集；/nS4.如果准确率达到设定目标则结束训练过程；如果准确率未达到目标则继续训练，执行步骤S5；/nS5.在部署平台上运行部署神经网络模型，得到部署神经网络模型结果，其输入数据为训练输入样本；/nS6.在神经网络训练平台对高精度神经网络训练模型进行训练，其输入数据为训练输入样本；第一次训练时载入的模型为原始高精度神经网络训练模型，之后训练时载入的模型为前一轮生成新高精度神经网络训练模型；修改训练结果用部署神经网络模型结果进行替代；/nS7.训练完成后得到新高精度神经网络训练模型，去除推断不相关算子，生成新高精度神经网络推断模型，执行步骤S2。/n

【技术特征摘要】
1.一种神经网络终端部署微调训练方法，其特征在于，该方法具体是：
S0.神经网络训练平台生成原始高精度神经网络训练模型；
S1.去除原始高精度神经网络训练模型中推断无关算子，生成原始高精度神经网络推断模型；
S2.编译生成部署神经网络模型；其第一次运行载入的模型为原始高精度神经网络推断模型，之后运行载入的模型为步骤S7生成的新高精度神经网络推断模型；
S3.在部署平台上运行部署神经网络模型，计算结果的准确率，其输入为测试集；
S4.如果准确率达到设定目标则结束训练过程；如果准确率未达到目标则继续训练，执行步骤S5；
S5.在部署平台上运行部署神经网络模型，得到部署神经网络模型结果，其输入数据为训练输入样本；
S6.在神经网络训练平台对高精度神经网络训练模型进行训练，其输入数据为训练输入样本；第一次训练时载入的模型为原始高精度神经网络训练模型，之后训练时载入的模型为前一轮生成新高精度神经网络训练模型；修改训练结果用部署神经网络模型结果进行替代；
S7.训练完成后得到新高精度神经网络训练模型，去除推断不相关算子，生成新高精度神经网络推断模型，执行步骤S2。

2.如权利要求1所述的一种神经网络终端部署微调训练方法，其特征在于：
所述的原始高精度神经网络推断模型为神经网络训练平台训练得到原始高精度神经网络训练模型删除推断不相关的算子得到的高精度推断模型；
所述的新高精度神经网络推断模型为神经网络训练平台训练得到新高精度神经网络训练模型删除推断不相关的算子得到的高精度推断模型；
所述的部署神经网络模型为高精度神经...

【专利技术属性】
技术研发人员：钟宇清，梁骏，宋一平，郑迪，黄磊，杨常星，宋蕴，
申请(专利权)人：杭州国芯科技股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人