【技术实现步骤摘要】
基于DSP芯片与量化模型的三维物体识别方法
本专利技术属于计算机视觉领域,更具体地,涉及一种基于DSP芯片与量化模型的三维物体识别方法。
技术介绍
将模型参数量化表示,称为量化模型,模型文件大小可以减少约3/4,同时可以将浮点运算转换为整型运算,理论上可以提高特征提取的速率。现有的基于DSP的特征提取器,利用DSP芯片可以并行计算的优势,相较于ARM架构的CPU,可以更快地完成深度网络中各种层的操作,包括卷积层、池化层、残差层等。使用点云数据进行物体识别,物体识别的方法有很多种,有使用二维数据的和使用三维点云数据的,该类专利技术或使用模式识别,或采用深度学习方法对对应的物体数据进行特征提取,最终完成识别任务。三维数据的特征提取器,该类专利技术的输入不是传统的图像数据(包含xy平面坐标,每个像素点的颜色),而是三维数据,如点云(包含xyz三维坐标,可能包含颜色和其他信息),不同于平面数据,点云数据是连续数据,若将其离散化,则非常稀疏,因此现有的高效方法常常是直接对原始点云信息进行操作,得到输入点云的特征值或特征向量。现有专利技术仅分别有上述部分,而未有将它们进行整合使用的,尽管这些技术的领域和方向不尽相同。现有的技术既没有量化的三维数据特征提取器,也没有基于DSP的三维数据特征提取器。之所以尚未有量化的三维数据特征提取器,是因为现有的网络量化结构多基于处理传统的二维图像设计,而要处理三维数据的网络结构的量化结构需要一些变体,如需要处理混合32位整形数和8位整形数、除了卷积外的一般运算的量 ...
【技术保护点】
1.一种基于DSP芯片与量化模型的三维物体识别方法,其特征在于,包括三维数据采集器、三维数据特征提取器以及特征解码器,所述的三维数据特征提取器包括量化参数模型存储模块和DSP并行计算加速模块;所述的三维数据采集器为RGB-D摄像头,拍摄后得到画面中物体的深度信息,最终合成为点云数据;将该点云数据输入到三维数据特征提取器中,特征提取器中的量化参数模型存储模块用于存量化模型的储参数,利用DSP并行计算加速模块加速特性,快速完成深度神经网络中卷积、池化、残差操作,最后得到输入数据的特征;特征解码器根据模型训练时对特征加密的方式反向解码,得到需要的特征格式。/n
【技术特征摘要】
1.一种基于DSP芯片与量化模型的三维物体识别方法,其特征在于,包括三维数据采集器、三维数据特征提取器以及特征解码器,所述的三维数据特征提取器包括量化参数模型存储模块和DSP并行计算加速模块;所述的三维数据采集器为RGB-D摄像头,拍摄后得到画面中物体的深度信息,最终合成为点云数据;将该点云数据输入到三维数据特征提取器中,特征提取器中的量化参数模型存储模块用于存量化模型的储参数,利用DSP并行计算加速模块加速特性,快速完成深度神经网络中卷积、池化、残差操作,最后得到输入数据的特征;特征解码器根据模型训练时对特征加密的方式反向解码,得到需要的特征格式。
2.根据权利要求1所述的基于DSP芯片与量化模型的三维物体识别方法,其特征在于,在使用量化参数模型存储模块存储参数时,需要获取量化模型,量化模型的获取方法包括训练时量化和训练后量化;
当为训练时量化是的步骤包括:首先,在模型训练时调用Tensorflow的tf.contrib.quantize.create_training_graph接口并实现该接口未支持的在一般操作后加入伪量化节点的功能,之后所有的运算操作后都有一个伪量化节点,伪量化节点储存上一个节点的最大值和最小值,使用这两个值,利用映射公式:Q=R/scale+zero_pt,即可将参数由32位浮点数存储的方式转换成用8位整型数的存储方式,其中R代表32位浮点数,Q代表8位整型数,scale是映射缩放,scale=(Vmax-Vmin)/255,zero_pt是映射零点,zero_pt=-255*Vmin/(Vmax–Vmin)=-Vmin/scale,其中Vmax与Vmin从伪量化节点中获取,255为8位无符号整型数可表示的最大值;
然后,在模型参数固定时,调用tf.contrib.quantize.create_eval_graph接口并实现该接口未支持的在一般操作后加入伪量化节点的功能。随后进行模型参数固定,参数固定后,调用tococonvert脚本,结合一般节点与其对应的伪量化节点的信息,得到量化模型;
当为训练后量化时的步骤包括:首先,在模型训练阶段使用一般的训练方法;
然后,在模型参数固定时,在权重、激活、矩阵乘法、加法等节点之后人工地加入伪量化节点,再向模型喂入部分训练数据以获得伪量化节点需要记录的关于上一节点的最大值和最小值;随后进行模型参数固定,参数固定后,调用tococonvert脚本,结合一般节点与其对应的伪量化节点的信息,得到量化模型。
3.根据权利要求2所述的基于DSP芯片与量化模型的三维物体识别方法,其特征在于,所述的DSP并行计算加速模块中DSP并行加速的方法包括:使用DSP指令时,使用直接内存访问DMA技术,将需要运算的数据直接放入DSP芯片内存中,运算结束后再次使用DMA将数据从DSP内存提取到设备内存中,其中,使用ARM框架的CPU与DSP芯片同时工作,即在DSP计算时,CPU同时在DMA,提取上一次DSP运算的结果,并准备将下一次DSP需要使用的数据写入DSP内存中,一旦DSP芯片计算完毕,则立刻执行DMA写入。
4.根据权利要求3所述的基于DSP芯片与量化模型的三维物体识别方法,其特征在于,基于DSP芯片与量化模型的三维物体识别方法,具体包括以下步骤:
S1.采集训练数据,采集方法为使用三维数据采集器采集物体的深度信息,去除背景和噪声信息后得到物体的点云数据;
S2.训练模型,使用可以端对端...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。