【技术实现步骤摘要】
基于自适应数据量化和多面体模板的图像识别方法及系统
[0001]本专利技术涉及图像识别
,特别是涉及一种基于自适应数据量化和多面体模板的图像识别方法及系统。
技术介绍
[0002]近些年来,随着边缘端设备数量和种类爆炸性增长,深度神经网络(Deep Neural Network,DNN)和各种边缘端设备的结合带来了众多的应用,例如特斯拉的自动驾驶、阿里巴巴云的城市大脑、人脸识别等。但是深度神经网络具有参数多、层数深等特征,这些特征对端侧设备的计算资源(例如设备的能耗、内存等)提出了巨大需求。因此,受限于端侧设备有限的资源,如何加速神经网络在端侧设备上的运行成为了很重要的一个问题。
[0003]为了节省计算资源,DNN压缩技术得到了广泛的应用。DNN压缩技术中一个重要的分支就是量化。所谓的量化是指将神经网络中连续分布的数值变为离散分布的数值,例如将float32的数据表示为int8的数据,从而使用更低位宽的编码方式表示数据,更低位宽的编码方式可以减少数据存储的空间、数据在总线上的搬运量,还可以有效降低操作数计算的 ...
【技术保护点】
【技术特征摘要】
1.一种基于自适应数据量化和多面体模板的图像识别方法,其特征在于,包括:获取端侧设备选取的以传统数据格式编码的神经网络;所述传统数据格式包括FP32数据格式;根据所述以传统数据格式编码的神经网络,采用基于贝叶斯优化的搜索算法确定自适应数据的浮点表达形式AFP的最优数值集合;所述最优数值集合包括所述神经网络中每一层对应的指数位位宽、尾数位位宽和偏移数值;根据所述最优数值集合,采用所述AFP格式编码所述神经网络,生成动态量化编码后的神经网络;获取基于多面体技术的代码模板以及所述端侧设备的内存大小;根据所述端侧设备的内存大小确定所述代码模板的最优参数;所述最优参数包括数据块大小;采用具有所述最优参数的代码模板描述所述动态量化编码后的神经网络每一层的数据计算方式,生成所述动态量化编码后的神经网络的可执行代码;获取以所述AFP格式编码的图像数据;所述图像数据包括人脸图像数据和物体图像数据;将所述可执行代码部署到所述端侧设备上对所述图像数据进行识别,得到图像识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述以传统数据格式编码的神经网络,采用基于贝叶斯优化的搜索算法确定AFP的最优数值集合,具体包括:根据贝叶斯优化算法生成多个可能数值的候选集合;根据预设的计算函数在所述候选集合中选取所述最优数值集合。3.根据权利要求1所述的方法,其特征在于,所述根据所述端侧设备的内存大小确定所述代码模板的最优参数,具体包括:根据所述端侧设备的内存大小确定搜索空间的候选集合;利用基于多面体技术分析的整数集库,将所述代码模板作为输入,输出表示计算关系的调度树;基于不同的调度树,采用两步搜索策略在所述搜索空间的候选集合中确定所述最优参数。4.根据权利要求1所述的方法,其特征在于,所述获取以所述AFP格式编码的图像数据,具体包括:采集所述端侧设备接收的图像;所述图像包括人脸图像或物体图像;采用所述AFP格式编码所述图像,生成以AFP格式编码的图像数据。5.一种基于自适应数据量化和多面体模板的图像识别系统,其特征在于,包括:传统编码神经网络获取模块,用于获取端侧设备选取...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。