【技术实现步骤摘要】
一种网络精度的量化方法及系统
[0001]本专利技术涉及神经网络
,具体而言,涉及一种网络精度的量化方法及系统。
技术介绍
[0002]相关技术中,神经网络在进行精度量化时,精度选择单一,只考虑了单个网络量化对资源利用的减少情况。没有解决众核芯片多个网络并存的情况下,如何对多个网络进行精度选择,实现片内资源合理分配的问题,导致芯片资源没有充分利用或者过度量化造成精度损失。
技术实现思路
[0003]为解决上述问题,本专利技术提供一种网络精度的量化方法及系统,能够提高多个网络并存下的芯片资源利用率,同时减少网络精度量化造成的精度损失。
[0004]本专利技术提供了一种网络精度的量化方法,所述方法应用于众核芯片,所述方法包括:
[0005]根据众核芯片的核资源总量以及各待量化网络,确定参考精度,其中,各待量化网络按照所述参考精度量化所需的核资源总量小于或等于所述众核芯片的核资源总量;
[0006]根据所述参考精度以及所述众核芯片的核资源总量,确定各待量化网络对应的目标精度。
...
【技术保护点】
【技术特征摘要】
1.一种网络精度的量化方法,其特征在于,所述方法应用于众核芯片,所述方法包括:根据众核芯片的核资源总量以及各待量化网络,确定参考精度,其中,各待量化网络按照所述参考精度量化所需的核资源总量小于或等于所述众核芯片的核资源总量;根据所述参考精度以及所述众核芯片的核资源总量,确定各待量化网络对应的目标精度。2.如权利要求1所述的方法,其中,根据众核芯片的核资源总量以及各待量化网络,确定参考精度,包括:确定各待量化网络按照第1精度量化所需的核资源总量S1;判断所述核资源总量S1是否小于或等于所述众核芯片的核资源总量Z;若所述核资源总量S1大于所述众核芯片的核资源总量Z,则确定各待量化网络按照第2精度量化所需的核资源总量S2,并判断所述核资源总量S2是否小于或等于所述众核芯片的核资源总量Z,其中,第2精度低于第1精度;按照量化精度逐级递减,依次类推,直至确定各待量化网络按照第j精度量化后所需的核资源总量S
j
小于或等于所述众核芯片的核资源总量Z,将第j精度确定为所述参考精度,其中,j为大于或等于2的整数。3.如权利要求1所述的方法,其中,根据所述参考精度以及所述众核芯片的核资源总量,确定各待量化网络对应的目标精度,包括:根据各待量化网络按照参考精度j量化所需的核资源总量S
j
以及所述众核芯片的核资源总量Z,确定剩余核资源量Y
j
,其中,Y
j
=Z-S
j
,j为大于或等于2的整数;确定所述各待量化网络按照各精度量化和按照第j精度量化的至少一个核资源数量差W[i]={M[i][1]-M[i][j],M[i][2]-M[i][j],...},其中,i用于表示待量化网络的编号,i为大于或等于1的整数;根据所述剩余核资源量Y
j
以及所述各待量化网络逐级量化的各核资源数量差,确定各待量化网络对应的目标精度。4.如权利要求3所述的方法,其中,根据所述剩余核资源量Y
j
以及所述各待量化网络逐级量化的各核资源数量差,确定各待量化网络对应的目标精度,包括:对每个待量化网络,从所述至少一个核资源数量差W[i]={M[i][1]-M[i][j],M[i][2]-M[i][j],...}中确定一个核资源数量差,以使在所述各待量化网络的各核资源数量差的总和小于或等于所述剩余核资源量Y
j
时,所述各待量化网络的各核资源差的总和最大;在所述各待量化网络的各核资源差的总和最大时,确定所述各待量化网络对应的目标精度。5.如权利要求1所述的方法,其中,所述各待量化网络包括第一类待量化网络以及第二类待量化网络,所述第二类待量化网络对应的目标精度为第k精度,根据所述参考精度以及所述众核芯片的核资源总量,确定各待量化网络对应的目标精度,包括:确定第一类待量化网络按照参考精度j
/
量化所需的核资源总量S
j/
以及第二类待量化网络按照指定精度k量化所需的核资源总量S
...
【专利技术属性】
技术研发人员:孟凡辉,胡川,李涵,张爱飞,吴欣洋,
申请(专利权)人:北京灵汐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。