一种输入数据的处理及指数值获取方法、装置及电子设备制造方法及图纸

技术编号:23671834 阅读:43 留言:0更新日期:2020-04-04 17:27
本发明专利技术公布了提供一种输入数据的处理及指数值获取方法、装置及电子设备,所述输入数据的处理方法包括:获取目标卷积神经网络的输入数据;将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值;根据所述预测指数值,对所述输入数据进行对齐,得到目标输入块浮点数;将所述目标输入块浮点数作为输入数据,输入到所述目标卷积神经网络。通过指数预测网络对输入数据的指数进行预测,通过预测得到的预测指数值对输入数据进行对齐,避免块浮点数和浮点数的转化以及求最大指数值的操作,提高指数值的获取速度,从而提高卷积神经网络推理速度。

A method, device and electronic equipment for processing input data and obtaining index value

【技术实现步骤摘要】
一种输入数据的处理及指数值获取方法、装置及电子设备
本专利技术涉及人工智能领域,更具体的说,是涉及一种输入数据的处理及指数值获取方法、装置及电子设备。
技术介绍
随着深度学习的快速发展,卷积神经网络已经大量应用于机器视觉应用,例如图像识别与图像分类。然而,卷积神经网络的算法复杂度导致其推理运行时间过长,阻碍了卷积神经网络在日常应用中的部署,量化作为一种卷积神经网络压缩技术,能效降低算法复杂度,从而大大减低运行推理时间,其中,块浮点数作为量化技术的一种,能有效降低做法复杂度,同时保持图像分类准确率,从而使卷积神经网络部署在日常应用成为可能。输入数据在块浮点数的表示之下,由于量化的过程中,会损失部分数据,导致块浮点数中的指数值并非为量化后的块浮点数的指数值,卷积操作的输入需要进行段浮点数对齐操作,其中包括了块浮点数和浮点数的转化,求最大指数值操作,由于块浮点数和浮点数的转化以及求最大指数值操作会花费较多的时间进行计算,从而增加卷积神经网络的推理时间,导致卷积神经网络推理速度慢。申请内容本专利技术的目的是针对上述现有技术存在的缺陷,提供一种输入数据的处理方法,解决卷积神经网络推理速度慢的问题。本专利技术的目的是通过以下技术方案来实现的:第一方面,提供一种输入数据的处理方法,所述输入数据用于卷积神经网络的输入,所述方法包括:获取目标卷积神经网络的输入数据,所述输入数据为批量浮点数或块浮点数,所述目标卷积神经网络为量化卷积神经网络;将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值;根据所述预测指数值,对所述输入数据进行对齐,得到目标输入块浮点数;将所述目标输入块浮点数作为输入数据,输入到所述目标卷积神经网络。进一步的,所述预设的指数预测网络包括预设的预测卷积神经网络,所述将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值,包括:获取随机指数值;根据所述随机指数值对所述输入数据进行对齐,并输入到预设的预测卷积神经网络进行预测,得到对应的结果预测值;若所述结果预测值满足预设条件,则确定所述结果预测值对应的随机指数值为预测指数值。进一步的,所述获取随机指数值,包括:获取初始随机指数值;以所述初始随机指数值为起点,在单调递增和/或单调递减方向上,依次获取多个随机指数值。进一步的,所述预设的预测卷积网络为预设的图像分类网络或图像识别网络,所述结果预测值为与所述图像分类网络或图像识别网络对应的分类准确率或识别准确率,所述根据所述随机指数值对所述输入数据进行对齐,并输入到预设的预测卷积神经网络进行预测,得到对应的结果预测值,包括:根据所述随机指数值对所述输入数据进行位移,以使所述输入数据对齐;将对齐后的输入数据输入到所述预设的图像分类网络或图像识别网络中进行预测,得到所述图像分类网络或图像识别网络对应的分类准确率或识别准确率。进一步的,所述方法还包括:判断所述分类准确率或识别准确率是否达到预设的准确率条件;所述若所述结果预测值满足预设条件,则确定所述结果预测值对应的随机指数值为预测指数值,包括:若所述分类准确率或识别准确率达到预设的准确率条件,则确定所述分类准确率或识别准确率对应的随机指数值为预测指数值。进一步的,所述目标神经网络包括至少一层卷积计算层,所述获取目标卷积神经网络的输入数据,包括:获取目标卷积计算层的输入数据;所述将所述目标输入块浮点数作为输入数据,输入到所述目标卷积神经网络,包括:将所述目标输入块浮点数作为输入数据,输入到所述目标卷积计算层。第二方面,提供一种输入数据的指数值获取方法,所述输入数据用于卷积神经网络的输入,所述方法包括:获取待对齐块浮点数;将所述待对齐块浮点数输入到预设的指数预测网络中对所述待对齐块浮点数的指数进行预测,得到预测指数值,所述预测指数值用于所述待对齐块浮点数的对齐操作。第三方面,提供一种输入数据的处理装置,所述输入数据用于卷积神经网络的输入,所述装置包括:获取模块,用于获取目标卷积神经网络的输入数据,所述输入数据为批量浮点数或块浮点数,所述目标卷积神经网络为量化卷积神经网络;指数预测模块,用于将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值;对齐模块,用于根据所述预测指数值,对所述输入数据进行对齐,得到目标输入块浮点数;输入模块,用于将所述目标输入块浮点数作为输入数据,输入到所述目标卷积神经网络。第四方面,提供一种输入数据的指数值获取装置,所述输入数据用于卷积神经网络的输入,所述装置包括:获取模块,用于获取待对齐的输入数据;指数预测模块,用于将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值,所述预测指数值用于输入数据的对齐。第五方面,提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本专利技术实施例提供的输入数据的处理方法中的步骤。第六方面,提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本专利技术实施例提供的输入数据的指数值获取方法中的步骤。第七方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术实施例提供的输入数据的处理方法中的步骤。第八方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术实施例提供的输入数据的指数值获取方法中的步骤。本专利技术带来的有益效果:获取目标卷积神经网络的输入数据;将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值;根据所述预测指数值,对所述输入数据进行对齐,得到目标输入块浮点数;将所述目标输入块浮点数作为输入数据,输入到所述目标卷积神经网络。通过指数预测网络对输入数据的指数进行预测,通过预测得到的预测指数值对输入数据进行对齐,避免块浮点数和浮点数的转化以及求最大指数值的操作,提高指数值的获取速度,从而提高卷积神经网络推理速度。附图说明图1为本专利技术实施例提供的一种输入数据的处理方法的流程示意图;图2为本专利技术实施例提供的一种预测指数值获取方法的流程示意图;图3为本专利技术实施例提供的一种输入数据的指数值获取方法的流程示意图;图4为本专利技术实施例提供的一种输入数据的处理装置的结构示意图;图5为本专利技术实施例提供的一种指数预测模块的结构示意图;图6为本专利技术实施例提供的一种获取单元的结构示意图;图7为本专利技术实施例提供的一种预测单元的结构示意图;图8为本专利技术实施例提供的另一种预测本文档来自技高网...

【技术保护点】
1.一种输入数据的处理方法,所述输入数据用于卷积神经网络的输入,其特征在于,所述方法包括:/n获取目标卷积神经网络的输入数据,所述输入数据为批量浮点数或块浮点数,所述目标卷积神经网络为量化卷积神经网络;/n将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值;/n根据所述预测指数值,对所述输入数据进行对齐,得到目标输入块浮点数;/n将所述目标输入块浮点数作为输入数据,输入到所述目标卷积神经网络。/n

【技术特征摘要】
1.一种输入数据的处理方法,所述输入数据用于卷积神经网络的输入,其特征在于,所述方法包括:
获取目标卷积神经网络的输入数据,所述输入数据为批量浮点数或块浮点数,所述目标卷积神经网络为量化卷积神经网络;
将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值;
根据所述预测指数值,对所述输入数据进行对齐,得到目标输入块浮点数;
将所述目标输入块浮点数作为输入数据,输入到所述目标卷积神经网络。


2.如权利要求1所述的输入数据的处理方法,其特征在于,所述预设的指数预测网络包括预设的预测卷积神经网络,所述将所述输入数据输入到预设的指数预测网络中对所述输入数据的指数进行预测,得到预测指数值,包括:
获取随机指数值;
根据所述随机指数值对所述输入数据进行对齐,并输入到预设的预测卷积神经网络进行预测,得到对应的结果预测值;
若所述结果预测值满足预设条件,则确定所述结果预测值对应的随机指数值为预测指数值。


3.如权利要求2所述的输入数据的处理方法,其特征在于,所述获取随机指数值,包括:
获取初始随机指数值;
以所述初始随机指数值为起点,在单调递增和/或单调递减方向上,依次获取多个随机指数值。


4.如权利要求2所述的输入数据的处理方法,其特征在于,所述预设的预测卷积网络为预设的图像分类网络或图像识别网络,所述结果预测值为与所述图像分类网络或图像识别网络对应的分类准确率或识别准确率,所述根据所述随机指数值对所述输入数据进行对齐,并输入到预设的预测卷积神经网络进行预测,得到对应的结果预测值,包括:
根据所述随机指数值对所述输入数据进行位移,以使所述输入数据对齐;
将对齐后的输入数据输入到所述预设的图像分类网络或图像识别网络中进行预测,得到所述图像分类网络或图像识别网络对应的分类准确率或识别准确率。


5.如权利要求4所述的输入数据的处理方法,其特征在于,所述方法还包括:
判断所述分类准确率或识别准确率是否达到预设的准确率条件;
所述若所述结果预测值满足预设条件,则确定所述结果预测值对应的随机指数值为预测指数值,包括:
若所述分类准确率或识别准确率达到预设的准确率条件,则确定所述分类准确率或识别准确率对应的随机指数值为预测指数值。


6.如权利要求1至...

【专利技术属性】
技术研发人员:范鸿翔牛昕宇蔡权雄
申请(专利权)人:深圳鲲云信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1