【技术实现步骤摘要】
用于确定二值卷积加速指标的方法及相关设备
本公开涉及人工智能
,尤其涉及一种用于确定二值卷积加速指标的方法及装置、电子设备和计算机可读介质。
技术介绍
目前,神经网络中使用最为广泛的是浮点卷积。但是浮点卷积占用内存较大,运行速度相对较慢。对于一些需要将运行速度提高至目标速度的任务来说,可以将浮点卷积替换为二值卷积。在实际操作中,如果要将神经网络中的浮点卷积替换为二值卷积以达到目标运行速度,就需要确定二值卷积相对于浮点卷积的加速指标,以实现对神经网络的设计,该加速指标可例如是二值卷积相对于浮点卷积的加速比。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此,本公开提供一种用于确定二值卷积加速指标的方法及装置、电子设备和计算机可读介质,能够给出目标设备进行二值卷积相较于进行浮点卷积的加速指标。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得 ...
【技术保护点】
1.一种用于确定二值卷积加速指标的方法,其特征在于,包括:/n获取目标设备的二值卷积的有效位数加速指标;/n获取所述目标设备的二值卷积的运算加速指标;/n获取浮点卷积加速指标;/n根据所述二值卷积的有效位数加速指标、所述运算加速指标和所述浮点卷积加速指标确定所述二值卷积加速指标,以用于根据所述二值卷积加速指标确定所述目标设备中的神经网络的二值神经网络。/n
【技术特征摘要】
1.一种用于确定二值卷积加速指标的方法,其特征在于,包括:
获取目标设备的二值卷积的有效位数加速指标;
获取所述目标设备的二值卷积的运算加速指标;
获取浮点卷积加速指标;
根据所述二值卷积的有效位数加速指标、所述运算加速指标和所述浮点卷积加速指标确定所述二值卷积加速指标,以用于根据所述二值卷积加速指标确定所述目标设备中的神经网络的二值神经网络。
2.根据权利要求1所述方法,其特征在于,获取目标设备的二值卷积的有效位数加速指标,包括:
获取所述目标设备进行浮点卷积操作时单个指令处理的浮点数据的比特数;
获取所述目标设备进行二值卷积操作时单个指令处理的二值数据的比特数;
根据所述单个指令处理的浮点数据的比特数和所述单个指令处理的二值数据的比特数确定所述有效位数加速指标。
3.根据权利要求1所述方法,其特征在于,获取所述目标设备的二值卷积的运算加速指标,包括:
获取所述目标设备进行一次二值乘加运算的运行时间和进行一次浮点乘加运算的运行时间;
根据所述一次二值乘加运算的运行时间和所述一次浮点乘加运算的运行时间确定所述运算加速指标。
4.根据权利要求1所述方法,其特征在于,获取浮点卷积加速指标,包括:
确定所述浮点卷积的加速方法,并根据所述加速方法确定所述浮点卷积加速指标。
5.根据权利要求1所述方法,其特征在于,可以根据以下公式确定所述二值卷积加速指标:
θ=Num*α*β/γ
其中,θ代表所述二值卷积加速指标,α代表所述有效位数加速指标,β代表所述...
【专利技术属性】
技术研发人员:张建浩,朱睿,梅涛,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。