一种执行卷积计算的系统及方法技术方案

技术编号：18302434 阅读：42 留言：0更新日期：2018-06-28 12:13

本发明专利技术提供一种以矩阵模式或者滤波器模式执行卷积计算的系统。分析模块生成模式选择信号，以基于分析卷积特征的结果而选择矩阵模式或者滤波器模式。该结果包括至少矩阵模式和滤波器模式之间的资源利用的比较。卷积模块包括多个处理元件，每个处理元件进一步包括算术计算电路。卷积模块用于根据矩阵模式执行自卷积计算转换而来的矩阵乘法，并用于根据滤波器模块执行卷积计算。本发明专利技术还提供了对应的方法。本发明专利技术能有效执行卷积计算，并提高资源利用率。

A system and method for calculating convolution

The present invention provides a system for performing convolution computation in matrix mode or filter mode. The analysis module generates the mode selection signal and selects matrix mode or filter mode based on the result of the analysis convolution feature. The result includes a comparison of resource utilization between at least matrix mode and filter mode. The convolution module comprises a plurality of processing elements, and each processing element further comprises an arithmetic calculation circuit. Convolution module is used to perform matrix multiplication based on matrix transformation, and is used to perform convolution calculation according to filter module. The present invention also provides a corresponding method. The invention can effectively perform convolution calculation and improve resource utilization ratio.

全部详细技术资料下载

【技术实现步骤摘要】
一种执行卷积计算的系统及方法优先权声明本申请主张在2016年12月20日提出的申请号为62/436,488号的美国临时专利申请的优先权，且上述美国专利申请整体以引用方式并入本文中。
本专利技术的实施例涉及用于卷积计算(convolutioncomputing)的计算机架构，更具体地，涉及一种执行卷积计算的系统及方法。
技术介绍
在计算机视觉、语音识别、自然语言处理和生物信息学的领域中，深度学习以其优越的性能已得到广泛的认可。深度学习是机器学习的分支，其利用包含多个隐藏层的人工神经网络。称为卷积神经网络(convolutionalneuralnetwork，CNN)的一种类型的人工神经网络由深度学习在大数据集上使用，例如，图像数据的大数据集。CNN已在图像应用中显现出良好的结果。例如，CNN可以被用在特征提取上。从输入端所接收的原始图像像素中，CNN可以在输出端为不同级别的特征生成分数。CNN的计算工作量很大。CNN的核心计算为卷积，其涉及高阶嵌套环(high-ordernestedloop)。对于特征提取，CNN在信道集(例如，红、绿和蓝)上对具有二维滤波器集的输入图像像素进行卷积，然后进行非线性计算、向下采样计算和级别分数计算。已经了解卷积计算对资源要求很高。除了CNN，卷积计算还经常用于解决科学问题和工程问题。因此，需要优化卷积计算以提高性能。
技术实现思路
本专利技术的目的在于，提供一种执行卷积计算的系统及方法，以解决上述问题。在一个实施例中，提供了一种用于执行卷积计算的系统。该系统包括分析模块，其根据分析多个卷积特征的多个结果，生成模式选择信号以选择矩...

【技术保护点】
1.一种执行卷积计算的系统，其特征在于，包括：分析模块，用于根据分析多个卷积特征的多个结果，生成模式选择信号以选择矩阵模式和滤波器模式中的一个，其中所述多个结果包括至少所述矩阵模式和所述滤波器模式之间的资源利用的比较；以及卷积模块，与所述分析模块耦接，包括多个处理元件，每个所述处理元件包括算术计算电路，其中所述卷积模块用于根据所述矩阵模式执行自多个卷积计算转换而来的多个矩阵乘法，并根据所述滤波器模式执行所述多个卷积计算。

【技术特征摘要】
2016.12.20 US 62/436,488;2017.10.19 US 15/787,8971.一种执行卷积计算的系统，其特征在于，包括：分析模块，用于根据分析多个卷积特征的多个结果，生成模式选择信号以选择矩阵模式和滤波器模式中的一个，其中所述多个结果包括至少所述矩阵模式和所述滤波器模式之间的资源利用的比较；以及卷积模块，与所述分析模块耦接，包括多个处理元件，每个所述处理元件包括算术计算电路，其中所述卷积模块用于根据所述矩阵模式执行自多个卷积计算转换而来的多个矩阵乘法，并根据所述滤波器模式执行所述多个卷积计算。2.如权利要求1中的执行卷积计算的系统，其特征在于，所述多个处理元件配置为两个二维阵列，所述两个二维阵列包括用于执行所述矩阵模式中的所述多个矩阵乘法的第一二维阵列，以及用于执行所述滤波器模式中的所述多个卷积计算的第二二维阵列。3.如权利要求1中的执行卷积计算的系统，其特征在于，所述多个处理元件用作一个混合二维阵列，所述混合二维阵列在运行期间根据所述模式选择信号执行所述矩阵模式中的所述多个矩阵乘法和所述滤波器模式中的所述多个卷积计算。4.如权利要求1中的执行卷积计算的系统，其特征在于，所述多个处理元件用作两个一维阵列，所述两个一维阵列包括用于执行所述矩阵模式中的所述多个矩阵乘法的第一一维阵列，以及用于执行所述滤波器模式中的所述多个卷积计算的第二一维阵列。5.如权利要求1中的执行卷积计算的系统，其特征在于，所述多个处理元件用作一个混合一维阵列，所述混合一维阵列在运行期间根据所述模式选择信号执行所述矩阵模式中的所述多个矩阵乘法和所述滤波器模式中的所述多个卷积计算。6.如权利要求1中的执行卷积计算的系统，其特征在于，还包括：数据调度引擎，用于根据所述模式选择信号将输入图像数据和多个滤波器权重调度到相应的所述多个处理元件中。7.如权利要求1中的执行卷积计算的系统，其特征在于，所述卷积计算包括卷积神经网络计算。8.如权利要求1中的执行卷积计算的系统，其特征在于，所述多个结果包括所述矩阵模式与所述滤波器模式之间的功率性能比较。9.如权利要求1中的执行卷积计算的系统，其特征在于，所述多个卷积特征包括输入图像的维度、所述卷积计算中所使用的滤波器的维度以及用于并行执行所述卷积计算的所述多个处理元件的纬度。10.如权利要求9中的执行卷积计算的系统，其特征在于，所述多个卷积特征还包括输入滤波器计数、关于所述输入图像的多个像素值的多个滤波器权重的步幅大小、输入数据批量尺寸、输入到所述卷积计算的所述多个滤波器权重和所述多个像素值的多个颜色信道排列以及所述卷积计算输出的多个卷积结果的多个颜色信道排...

【专利技术属性】
技术研发人员：蔡松芳，丛培贵，范博钧，赖守仁，
申请(专利权)人：联发科技股份有限公司，
类型：发明
国别省市：中国台湾,71

全部详细技术资料下载我是这个专利的主人