一种基于向量差值计算的模型边缘端部署优化方法及系统技术方案

技术编号:40578629 阅读:62 留言:0更新日期:2024-03-06 17:20
本发明专利技术公开一种基于向量差值计算的模型边缘端部署优化方法及系统,涉及模型部署技术领域。针对校园场景中的摄像头多、需要部署的算法多、部署的边缘服务器算力弱的问题,采用方案:对YOLOv5模型进行量化转换,将32位浮点数转换为低位宽的整数;执行量化后的模型,从中获取量化后推理数据和原框架模型的矩阵数据;对量化后数据进行向量差值计算,找出精度误差超出设定阈值的算子,针对找出的算子,进行模型优化;再次量化优化后的模型;至再次量化后的模型带来的误差在设定范围内,将此模型部署到边缘设备。本发明专利技术可以满足校园安防系统的实际需求,确保模型的高效部署和高精度识别。

【技术实现步骤摘要】

本专利技术涉及模型部署,具体的说是一种基于向量差值计算的模型边缘端部署优化方法及系统


技术介绍

1、随着计算机技术和图像处理技术的发展,安防监控摄像头在各类场景,尤其是校园中的广泛应用已成为当下的标配。但随之而来的是,如何高效、准确地处理这些大量的图像数据,尤其在资源受限的边缘服务器上,成为了一个亟待解决的问题。

2、传统的中心服务器处理方式,即将摄像头捕获到的数据上传到中央服务器进行处理,这种方式存在着数据传输延时高、中央服务器负担重、数据安全隐患大等问题。而边缘计算作为一种新型的计算模式,它可以将数据处理任务部署在接近数据源的地方,从而减少数据传输延时,提高处理效率。但边缘计算设备,尤其是边缘服务器往往计算能力有限,直接部署复杂的深度学习模型可能导致运行缓慢或无法运行。为了解决这个问题,研究者们提出了模型量化的方法,即将模型中的参数和计算过程简化,以适应边缘设备的计算能力。但这种方法往往会导致模型精度的下降,从而影响到模型的应用效果。如何在边缘设备上部署模型,同时既保证运行效率又不损失太多的模型精度,是当前研究的一个重要方向。

...

【技术保护点】

1.一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,执行步骤S3,采用余弦相似度、最大绝对偏差、欧几里得距离、Kullback-Leibler散度、标准偏差中的任一种比对方法对量化后推理数据和矩阵数据进行向量差值计算。

3.根据权利要求1所述的一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,针对步骤S5,采取以下方法中的一种或两种及两种以上的组合进行模型优化:

4.根据权利要求1所述的一种基于向量差值计算的模型边缘端部署优化方法,其特征...

【技术特征摘要】

1.一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,执行步骤s3,采用余弦相似度、最大绝对偏差、欧几里得距离、kullback-leibler散度、标准偏差中的任一种比对方法对量化后推理数据和矩阵数据进行向量差值计算。

3.根据权利要求1所述的一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,针对步骤s5,采取以下方法中的一种或两种及两种以上的组合进行模型优化:

4.根据权利要求1所述的一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,执行步骤s6,采取以下方法中的一种或两种及两种以上的组合对优化后的模型进行再次量化:

5.根据权利要求1所述的一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,执行步骤s2,执行量化后的模型,从中获取量化后的推理数据和原框架模型的矩阵数据,这一过程中,需要准备的基准数据来源于onnx、caffe、tensorflow、pytorch推理框架生成的矩阵格式原始数据文件。

<...

【专利技术属性】
技术研发人员:李耀王凯唐政姜宇瑄曹继华
申请(专利权)人:浪潮通信信息系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1