【技术实现步骤摘要】
具有可变输出数据格式的深度神经网络的硬件实现
本专利技术涉及具有可变输出数据格式的深度神经网络的硬件实现。
技术介绍
深度神经网络(DNN)是可以用于机器学习应用的一种类型人工神经网络。具体地,DNN可以用在信号处理应用中,包括图像处理和计算机视觉应用。DNN已经在功率资源并不是重要因素的应用中实施。尽管如此,DNN应用于许多不同的
,其中用来实施DNN的硬件的资源使得功耗、处理能力或硅面积受限。因此,需要实施被配置成以有效的方式(即,以在操作时需要较少硅面积或较少处理能力的方式)实施DNN的硬件。此外,DNN可以以许多不同的方式被配置成用于多种不同的应用。因此,还需要用于灵活地实施DNN以便能够支持多种DNN配置的硬件。仅通过实例方式提供下文描述的实施例,并且不限制解决了深度神经网络的已知硬件实现的任何或所有缺点的实现。
技术实现思路
提供本
技术实现思路
以便介绍下文在具体实施方式中进一步描述的概念的选择。本
技术实现思路
并不意图标识所要求保护的主题的关键特征或基本特征,也不意图限制所要求保护的主题的范围。本文中描述具有可变输出数据格式的DNN的硬件实现和相关方法。具体地,在本文所述的硬件实现和方法中,硬件实现被配置成:执行一个或多个硬件遍历(hardwarepass)来实施DNN,其中在每个遍历期间,硬件实现接收用于特定层的输入数据;根据所述特定层(以及可选地一个或多个后续层)来处理所述输入数据;并且基于在特定硬件遍历中处理的一个或多个层而输出期望格式的经处理数据。具体地,当硬件实现接收待处理的输入数据时,硬件实现还接收指示硬件遍历的输出数据的期望格式的 ...
【技术保护点】
1.一种深度神经网络“DNN”的硬件实现中的方法(500),所述硬件实现被配置成通过使用一个或多个硬件遍历处理数据来实施所述DNN,所述方法(500)包括:接收用于所述硬件实现的硬件遍历的输入数据集,所述输入数据集表示用于所述DNN的特定层的输入数据的至少一部分(502);接收指示所述硬件遍历的期望输出数据格式的信息(504);根据与所述硬件遍历相关联的所述DNN的一个或多个层来处理所述输入数据集,以产生经处理的数据,所述一个或多个层包括所述DNN的特定层(506);以及将所述经处理的数据转换成所述硬件遍历的期望输出数据格式,以产生所述硬件遍历的输出数据(508)。
【技术特征摘要】
2017.09.20 GB 1715215.81.一种深度神经网络“DNN”的硬件实现中的方法(500),所述硬件实现被配置成通过使用一个或多个硬件遍历处理数据来实施所述DNN,所述方法(500)包括:接收用于所述硬件实现的硬件遍历的输入数据集,所述输入数据集表示用于所述DNN的特定层的输入数据的至少一部分(502);接收指示所述硬件遍历的期望输出数据格式的信息(504);根据与所述硬件遍历相关联的所述DNN的一个或多个层来处理所述输入数据集,以产生经处理的数据,所述一个或多个层包括所述DNN的特定层(506);以及将所述经处理的数据转换成所述硬件遍历的期望输出数据格式,以产生所述硬件遍历的输出数据(508)。2.一种深度神经网络“DNN”的硬件实现(200),所述硬件实现被配置成通过使用一个或多个硬件遍历处理数据来实施所述DNN,所述硬件实现包括:输入模块(202),被配置成接收用于所述硬件实现的硬件遍历的输入数据集,所述输入数据集表示用于所述DNN的特定层的输入数据的至少一部分;解码器(206),被配置成接收指示所述硬件遍历的期望输出数据格式的信息;处理模块(204),被配置成根据与所述硬件遍历相关联的所述DNN的一个或多个层来处理所述输入数据集,以产生经处理的数据,所述一个或多个层包括所述DNN的特定层;以及输出模块(208),被配置成将所述经处理的数据转换成所述硬件遍历的期望输出数据格式,以产生所述硬件遍历的输出数据。3.根据权利要求2所述的硬件实现,其中:所述输入模块还被配置成接收用于所述硬件实现的不同硬件遍历的第二输入数据集;所述解码器还被配置成接收指示所述不同硬件遍历的期望输出格式的信息,所述不同硬件遍历的期望输出格式不同于所述硬件遍历的期望输出数据格式;所述处理模块还被配置成根据所述DNN的一个或多个层来处理所述第二输入数据集,以产生第二经处理的数据;并且所述输出模块还被配置成将所述第二经处理的数据转换成所述不同硬件遍历的期望输出数据格式,以产生第二输出数据。4.根据权利要求3所述的硬件实现,其中,所述第二输入数据集包括用于所述DNN的特定层的输入数据的一部分;或者其中,所述第二输入数据集包括用于所述DNN的另一层的输入数据的至少一部分。5.根据权利要求4所述的硬件实现,其中,所述第二输入数据集包括用于另一层的输入数据的至少一部分,并且所述第二输入数据集包括采用所述期望输出数据格式的所述输出数据的至少一部分。6.根据权利要求2至5中任一项所述的硬件实现,其中,所述输出模块还被配置成将采用所述期望输出数据格式的所述输出数据存储在存储器中;并且所述输入模块还被配置成从存储器中读取采用所述期望输出数据格式的所述输出数据,作为用于另一硬件遍历的输入数据集。7.根据权利要求2至5中任一项所述的硬件实现,其中,所述一个或多个层包括至少两个层,并且所述处理模块被配置成通过根据所述至少两个层中的一个层使用第一输入数据格式处理所述输入数据集并且根据所述至少两个层中的另一层使用第二输入数据格式处理所述输入数据集,而根据所述至少两个层来处理所述数据集,其中,所述第一输入数据格式和所述第二输入数据格式独立于所述硬件遍历的所述期望输出数据格式。8.根据权利要求7所述的硬...
【专利技术属性】
技术研发人员:克里斯·马丁,大卫·霍夫,保罗·布拉塞特,卡加泰·迪基奇,詹姆斯·因贝尔,克利福德·吉布森,
申请(专利权)人:畅想科技有限公司,
类型:发明
国别省市:英国,GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。