深度神经网络的卷积层的硬件实现制造技术

技术编号：21687055 阅读：19 留言：0更新日期：2019-07-24 14:55

本公开涉及深度神经网络的卷积层的硬件实现。提供了深度神经网络DNN的卷积层的硬件实现和用于处理DNN的卷积层的方法，该硬件实现包括多个卷积引擎，其中，以这样的顺序来将输入数据和权重提供给卷积引擎，该顺序允许从存储器读取输入数据和权重以用于在连续周期中由相同卷积引擎执行或在同一周期中由不同卷积引擎执行的至少两个滤波器‑窗口计算。例如，在卷积层的一些硬件实现中，卷积引擎被配置为在每个周期处理相同的权重以及不同的输入数据，然而每个卷积引擎的输入数据在至少两个周期内保持相同，使得卷积引擎在至少两个连续周期中使用相同的输入数据。

Hardware Implementation of Convolution Layer of Deep Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
深度神经网络的卷积层的硬件实现
本公开涉及神经网络，更具体地，涉及深度神经网络的卷积层的硬件实现。
技术介绍
深度神经网络(DNN)是一种可用于机器学习应用的人工神经网络。特别地，DNN可以用于信号处理应用，包括图像处理和计算机视觉应用。DNN已经实现于功率资源不是重要因素的应用中。尽管如此，DNN还应用于许多不同的
，在这些
中，用于实现DNN的硬件资源使得功耗、处理能力或硅面积受到限制。因此，需要实现被配置为以有效方式(即以在操作时需要更少硅面积或更少处理能力的方式)实现DNN(或其至少一部分)的硬件。此外，DNN可以针对各种不同的应用以多种不同的方式来配置。因此，还需要用于实现DNN的、能够支持各种DNN配置的灵活的硬件。下文描述的实施例仅作为示例提供，并不是作为对解决深度神经网络(或其一部分)的已知硬件实现的任何或所有缺点的实现方式的限制。
技术实现思路
提供本
技术实现思路
以介绍下面在具体实施方式中进一步描述的概念的选择。本
技术实现思路
不用于识别请求保护的主题的关键特征或本质特征，也不用于限制请求保护的主题的范围。本文描述的是用于DNN的卷积层的硬件实现和处理DNN的卷积层的方法，该硬件实现包括多个卷积引擎，其中，以这样的顺序来将输入数据和权重提供给卷积引擎，该顺序允许从存储器读取输入数据和权重以用于在连续周期中由相同卷积引擎执行或在同一周期中由不同卷积引擎执行的至少两个滤波器-窗口计算。例如，在卷积层的一些硬件实现中，卷积引擎被配置为在每个周期处理相同的权重以及不同的输入数据，然而每个卷积引擎的输入数据在至少两个周期内保持相同，使得卷积引...

【技术保护点】
1.一种深度神经网络的卷积层的硬件实现，所述硬件实现包括：多个卷积引擎，每个卷积引擎包括硬件逻辑，所述硬件逻辑被配置为在多个周期中的每个周期中接收权重集和输入数据值集，并且对所述权重集和所述输入数据值集执行乘法累加操作；其中，在任何周期中，所有卷积引擎接收相同的权重集，并且每个卷积引擎从其他卷积引擎接收不同的输入数据值集；以及其中，在至少一个周期中，所述卷积引擎接收在先前周期中接收到的相同的输入数据值集。

【技术特征摘要】
2017.11.03 GB 1718297.31.一种深度神经网络的卷积层的硬件实现，所述硬件实现包括：多个卷积引擎，每个卷积引擎包括硬件逻辑，所述硬件逻辑被配置为在多个周期中的每个周期中接收权重集和输入数据值集，并且对所述权重集和所述输入数据值集执行乘法累加操作；其中，在任何周期中，所有卷积引擎接收相同的权重集，并且每个卷积引擎从其他卷积引擎接收不同的输入数据值集；以及其中，在至少一个周期中，所述卷积引擎接收在先前周期中接收到的相同的输入数据值集。2.如权利要求1所述的硬件实现，还包括系数缓冲器，该系数缓冲器被配置为：存储用于卷积层的多个权重；以及在多个周期中向所述卷积引擎提供所述多个权重，其中在任何周期中，所有卷积引擎都被提供以来自所述多个权重中的相同权重集。3.如权利要求2所述的硬件实现，其中，所述系数缓冲器被配置为以预定顺序向所述卷积引擎提供包括第一权重集和最后一个权重集在内的权重。4.如权利要求3所述的硬件实现，其中，所述系数缓冲器被配置为：一旦其已经向所述卷积引擎提供了所述最后一个权重集，其便在下一个周期再次向所述卷积引擎提供所述第一权重集。5.如权利要求3所述的硬件实现，其中，所述多个权重按照向所述卷积引擎提供权重的顺序被存储在所述系数缓冲器中。6.如任一前述权利要求所述的硬件实现，还包括输入缓冲器，所述输入缓冲器被配置为：存储用于卷积层的多个输入数据值；以及在多个周期内向所述卷积引擎提供所述多个输入数据值，其中，在任何周期中，所述卷积引擎被提供以来自所述多个输入数据值的不同输入数据值集，并且在至少两个连续周期中相同的输入数据值集被提供给所述卷积引擎。7.如权利要求6所述的硬件实现，其中，所述输入缓冲器还被配置为：在第一次向卷积引擎提供输入数据值集之前，从所述输入缓冲器的存储器中获取该输入数据值集。8.如权利要求6所述的硬件实现，其中，所述多个输入数据值表示三维量，并且每个输入数据值集表示该三维量的窗口的全部或部分。9.如权利要求8所述的硬件实现，其中，在周期中被提供给所述卷积引擎的不同的输入数据值集表示水平相邻窗口的全部或部分。10.如权利要求9所述的硬件实现，其中，所述输入缓冲器还被配置为：在第一次向卷积引擎提供输入数据值集之前，从所述输入缓冲器的存储器中获取该输入数据值集；对从存储器中获取的K个最近的输...

【专利技术属性】
技术研发人员：克里斯·马丁，大卫·霍夫，克利福德·吉布森，丹尼尔·巴纳德，
申请(专利权)人：畅想科技有限公司，
类型：发明
国别省市：英国,GB

全部详细技术资料下载我是这个专利的主人