【技术实现步骤摘要】
深度神经网络硬件实现的基于直方图的每层数据格式选择
本专利技术涉及用于深度神经网络的硬件实现的基于直方图的每层数据格式选择。
技术介绍
深度神经网络(DNN)是可以用于机器学习应用的一种人工神经网络。具体地,DNN可以用于信号处理应用,包括图像处理和计算机视觉应用。DNN已经在其中功率资源不是重要因素的应用中被实现。尽管如此,DNN还应用于许多不同的
,在这些领域中用于实现DNN的硬件资源的功耗、处理能力或硅面积是有限的。因此,需要实现被配置为以有效方式(即,以在操作时需要更少硅面积或更少处理能力的方式)实现DNN的硬件。此外,DNN可以以多种不同的方式被配置以用于各种不同的应用。因此,还需要用于实现DNN的硬件能够灵活地支持各种DNN配置。以下描述的实施例仅作为示例被提供,并且不限制解决深度神经网络的已知硬件实现的任意或所有缺点的实现方式。
技术实现思路
本
技术实现思路
被提供介绍将在以下详细描述中进一步描述的一些概念。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。本文描述的是一种选择用于表示输入至和/或输出自深度神经网络(DNN)的一个层的一组值的定点数格式的基于直方图的方法。该方法包括获得表示该层的一组值的预期分布的直方图,其中该直方图的每个bin与频率值相关联;根据多个可能的定点数格式中的每个定点数格式来量化针对每个bin的浮点数格式的代表值;针对多个可能的定点数格式中的每个定点数格式,基于直方图的频率值和针对每个bin的距离值来估计由量化产生的总量化误差,该距离值基于针对该bin的代表值的量 ...
【技术保护点】
1.一种标识用于表示输入至和/或输出自深度神经网络“DNN”的一个层的一组值的定点数格式以用于配置DNN的硬件实现的计算机实现的方法(400),所述方法(400)包括:获得表示该层的该组值的预期分布的直方图,其中,所述直方图的每个bin与频率值相关联(402);针对多个定点数格式中的每个定点数格式(404,410):根据所述定点数格式来量化针对每个bin的浮点数格式的代表值(406);并且基于针对每个bin的频率值和距离值来估计与所述定点数格式相关联的总量化误差(408),所述距离值基于针对该bin的代表值的量化;以及选择多个定点数格式中与最小估计总量化误差相关联的定点数格式作为用于表示该层的该组值的定点数格式(412)。
【技术特征摘要】
2017.11.03 GB 1718293.21.一种标识用于表示输入至和/或输出自深度神经网络“DNN”的一个层的一组值的定点数格式以用于配置DNN的硬件实现的计算机实现的方法(400),所述方法(400)包括:获得表示该层的该组值的预期分布的直方图,其中,所述直方图的每个bin与频率值相关联(402);针对多个定点数格式中的每个定点数格式(404,410):根据所述定点数格式来量化针对每个bin的浮点数格式的代表值(406);并且基于针对每个bin的频率值和距离值来估计与所述定点数格式相关联的总量化误差(408),所述距离值基于针对该bin的代表值的量化;以及选择多个定点数格式中与最小估计总量化误差相关联的定点数格式作为用于表示该层的该组值的定点数格式(412)。2.根据权利要求1所述的方法(400),其中,所述多个定点数格式中的每个定点数格式包括指数和尾数位长度。3.根据权利要求2所述的方法(400),其中,所述多个定点数格式中的每个定点数格式包括相同的尾数位长度和不同的指数。4.根据权利要求2所述的方法(400),其中,所述多个定点数格式中的每个定点数格式包括不同的尾数位长度和相同的指数。5.根据权利要求1所述的方法(400),其中,估计与定点数格式相关联的总量化误差包括确定针对每个bin的频率值和距离值的乘积的总和。6.根据权利要求1所述的方法(400),其中,针对每个bin的距离值是浮点数格式的针对该bin的代表值与根据所述定点数格式量化的针对该bin的代表值之间的差。7.根据权利要求1所述的方法(400),其中,针对每个bin的距离值是浮点数格式的针对该bin的代表值与根据所述定点数格式量化的针对该bin的代表值之间的平方差。8.根据权利要求1所述的方法(400),其中,针对每个bin的距离值是浮点数格式的针对该bin的代表值与根据所述定点数格式量化的针对该bin的代表值之间的平方差与该bin的代表值的权重的乘积,其中,所述定点数格式的可表示范围之外的代表值的权重高于所述定点数格式的可表示范围内的代表值的权重。9.根据权利要求8所述的方法(400),其中,当代表值落入所述定点数格式中的最大可表示数与所述定点数格式中的最小可表示数之间时,所述代表值处于所述定点数格式的可表示范围内。10.根据权利要求8所述的方法(400),其中,所述权重在所述定点数格式的可表示范围之外线性地增加。11.根据权利要求1至10中任一项所述的方法(400),还包括存储选择的定点数格式以用于配置所述DNN的硬件实现。12.根据权利要求1至10中任一项所述的方法(400),还包括配置所述DNN的硬件实现...
【专利技术属性】
技术研发人员:詹姆斯·因贝尔,卡加泰·迪基奇,
申请(专利权)人:畅想科技有限公司,
类型:发明
国别省市:英国,GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。