适用于任意维数卷积需求的可重构计算结构及计算调度方法和装置制造方法及图纸

技术编号:16837325 阅读:44 留言:0更新日期:2017-12-19 19:52
本发明专利技术涉及一种适用于任意维数卷积需求的可重构计算结构及计算调度方法和装置,可重构计算结构包含接口控制器和可重构计算模块,所述的可重构计算模块至少包含一个乘累加计算处理阵列,每个乘累加计算处理阵列中包含多个乘累加运算处理单元,每个乘累加运算处理单元配置有各自对应的内部总线,两两乘累加运算处理单元之间通过内部总线互连并与控制总线相连;接口控制器通过控制总线对乘累加运算处理单元之间互联方式及乘累加运算处理单元的分时复用次数进行调度管理。本发明专利技术针对任意维数卷积通过快速重构具有不同计算功能处理单元的方式实现卷积计算,提高可变维数卷积计算的灵活性,充分挖掘计算过程的并行性与流水性,大幅提高卷积计算效率。

Reconfigurable computing structure and computing scheduling method and device for arbitrary dimension convolution demand

The invention relates to a method for arbitrary dimension convolution needs of reconfigurable computing method and device structure and scheduling, reconfigurable computing architecture includes interface controller and reconfigurable computing module, wherein the reconstruction calculation module includes at least one MAC computing array, each MAC computing array containing multiple the cumulative processing unit, each MAC processing unit configuration has the corresponding internal bus, 22 MAC processing internal bus interconnection between and connected with the control unit through the bus interface controller; scheduling and management of MAC processing mode of interconnection between units and MAC processing unit of time division multiplexing frequency by controlling bus. The invention realizes convolution calculation for any dimension convolution by rapidly reconstructing different computing function processing units, improving flexibility of variable dimension convolution calculation, fully mining parallelism and pipelining of computation process, and greatly improving convolution calculation efficiency.

【技术实现步骤摘要】
适用于任意维数卷积需求的可重构计算结构及计算调度方法和装置
本专利技术属于卷积可重构计算
,特别涉及一种适用于任意维数卷积需求的可重构计算结构及计算调度方法和装置。
技术介绍
卷积是一种数学积分变换的方法,也是分析数学中一种重要的运算,在电子通信、物理学、统计学、地震预测、图像处理以及油田勘察等诸多方面有着十分广泛的应用。对于一维离散卷积,假设输入为N1点序列f(n1)与N2点序列h(n2),输出序列N1+N2-1点序列g(n),则有:对于二维离散卷积,假设输入为M1×N1维矩阵f(m1,n1)与M2×N2维矩阵h(m2,n2),输出(M1+M2-1)×(N1+N2-1)维矩阵g(m,n),则有:卷积的计算有两种方法:一是时域方法,计算过程直观清晰,主要涉及乘法和加法计算,时域卷积计算方法虽然计算量较大,但不同点之间的计算过程在时间和空间上均无耦合,可通过并行化计算结构设计加速;二是频域方法,将卷积序列通过FFT计算变换到频域,然后通过频域数据相乘并反变换得到卷积计算结果。近年来,随着人工智能与机器学习的飞速发展,卷积神经网络(CNN)因其在图像处理中的巨大优势受到越来越大的关注。CNN中的卷积计算与一维或二维卷积计算过程有一定的不同,无法基于频域计算方法实现,只能在时域通过乘累加的方式计算。上述两种卷积计算过程存在大量可并行化设计的内在特点,因此需要通过设计合理的计算结构,多维度并行化实现计算过程来提高卷积的计算效率。
技术实现思路
针对现有技术中的不足,本专利技术提供一种适用于任意维数卷积需求的可重构计算结构及计算调度方法和装置,针对任意维数卷积,通过快速重构具有不同计算功能处理单元的方式实现卷积计算,不仅能够使系统具有计算可变维数卷积的灵活性,同时能够充分挖掘计算过程中的并行性与流水性,大幅提高系统的计算效率。按照本专利技术所提供的设计方案,一种适用于任意维数卷积需求的可重构计算结构,包含接口控制器,可重构计算模块,所述的可重构计算模块至少包含一个乘累加计算处理阵列,每个乘累加计算处理阵列中包含多个乘累加运算处理单元,每个乘累加运算处理单元配置有各自对应的内部总线,两两乘累加运算处理单元之间通过内部总线互连并与控制总线相连;接口控制器通过控制总线对乘累加运算处理单元之间互联方式及乘累加运算处理单元的分时复用次数进行调度管理。上述的,所述的可重构计算模块还包含至少一个加法计算处理阵列,每个加法计算处理阵列中包含多个加法运算处理单元,每个加法运算处理单元配置有各自对应的内部总线;两两加法运算处理单元之间通过内部总线互联,并通过内部总线、控制总线与接口控制器相连。一种适用于任意维数卷积需求的可重构计算调度方法,基于上述的适用于任意维数卷积需求的可重构计算结构实现,具体包含如下内容:根据卷积计算需求进行运算处理单元重构时,确定功能满足所述卷积计算需求的卷积结果矩阵;依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,选定当前可用计算资源中用于计算的单个运算处理单元,读取卷积结果矩阵中的元素并基于该单个运算处理单元的反复调用分时序贯对卷积结果矩阵中的各个元素进行计算,将元素计算结果反馈至外存主机进行存储,迭代循环,直至完成卷积结果矩阵中所有元素的计算。进一步地,依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,基于当前可用计算资源情况中各个运算处理单元的并行进行配置并选定用于计算的若干运算处理单元,确定卷积结果矩阵中各个元素并行化运算过程中各个元素计算分组及各个元素计算分组与选定的若干运算处理单元之间的对应关系;选定的若干运算处理单元按照预设顺序依次迭代计算相应元素计算分组中的元素并将计算结果反馈至外存主机进行存储,直至计算完该元素计算分组内所有元素,完成卷积结果矩阵中所有元素的计算。优选地,所述的预设顺序为矩阵按行顺序或按列顺序。一种适用于任意维数卷积需求的可重构计算方法,基于上述的适用于任意维数卷积需求的可重构计算结构实现,具体包含如下内容:根据卷积计算需求进行运算处理单元重构时,确定功能满足所述卷积计算需求的卷积结果矩阵;依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,基于当前可用计算资源情况中各个乘累加运算处理单元与加法运算处理单元之间的并行组合进行配置并选定用于计算的若干运算处理单元组,确定卷积结果矩阵中各个元素并行化运算过程中各个元素计算分组及各个元素计算分组与选定的若干运算处理单元组之间的对应关系;选定的若干运算处理单元组中按照预设顺序依次迭代计算相应元素计算分组中的元素并将计算结果反馈至外存主机进行存储,直至计算完该元素计算分组内所有元素,完成卷积结果矩阵中所有元素的计算。进一步地,所述的运算处理单元组包含多个乘累加运算处理单元和至少一个互联的加法运算处理单元,将每个元素计算分组的计算数据划分为待并行计算若干部分数据单元,该若干部分数据单元中每个数据单元与多个乘累加运算处理单元中单个乘累加运算处理单元两者为一一对应关系。一种适用于任意维数卷积需求的可重构计算装置,包含:用于数据交互的通信接口及数据通道;预设模块,用于根据卷积计算需求确定功能满足的卷积结果矩阵;配置调度模块,用于配置当前可用计算资源中用于计算的运算处理单元,并将配置信息及待计算数据通过数据通道发送至接口控制器;迭代计算模块,接口控制器将待计算数据发送至对应运算处理单元进行循环迭代计算,并将计算结果反馈至存储模块;存储模块,用于存储待计算数据及运算处理单元反馈的计算结果。上述的可重构计算装置中,所述的配置调度模块,用于依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,并基于乘累加运算处理单元的分时复用配置当前可用计算资源中用于计算的运算处理单元。上述的可重构计算装置中,所述的配置调度模块,用于依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,并基于当前可用计算资源情况中各个运算处理单元的并行进行配置,选定用于计算的若干运算处理单元,确定卷积结果矩阵中各个元素并行化运算过程中的各个元素计算分组和各个元素计算分组与选定的若干运算处理单元之间的对应关系。进一步地,所述的迭代计算模块,若干运算处理单元按照预设顺序依次迭代计算相应元素计算分组中的元素并将计算结果反馈至存储模块进行存储,直至计算完该元素计算分组内所有元素,完成卷积结果矩阵中所有元素的计算。上述的可重构计算装置中,所述的配置调度模块,用于依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,基于当前可用计算资源情况中各个乘累加运算处理单元与加法运算处理单元之间的并行组合进行配置并选定用于计算的若干运算处理单元组,确定卷积结果矩阵中各个元素并行化运算过程中各个元素计算分组及各个元素计算分组与选定的若干运算处理单元组之间的对应关系。进一步地,所述的配置调度模块还包含元素计算分组数据划分单元,用于将每个元素计算分组的计算数据划分为待并行计算的若干部分数据单元;所述的配置调度模块中每个运算处理单元组包含多个乘累加运算处理单元和至少一个互联的加法运算处理单元,待并行计算的若干部分数据单元中的单部分数据单元与多个乘累加运算处理单元中单个乘累加运算处理单元两者为一一对应关系。进一步地,所述的迭代计算模块,若干运算处理单元组中按照本文档来自技高网...
适用于任意维数卷积需求的可重构计算结构及计算调度方法和装置

【技术保护点】
一种适用于任意维数卷积需求的可重构计算结构,包含接口控制器,可重构计算模块,其特征在于,所述的可重构计算模块至少包含一个乘累加计算处理阵列,每个乘累加计算处理阵列中包含多个乘累加运算处理单元,每个乘累加运算处理单元配置有各自对应的内部总线,两两乘累加运算处理单元之间通过内部总线互连并与控制总线相连;接口控制器通过控制总线对乘累加运算处理单元之间互联方式及乘累加运算处理单元的分时复用次数进行调度管理。

【技术特征摘要】
1.一种适用于任意维数卷积需求的可重构计算结构,包含接口控制器,可重构计算模块,其特征在于,所述的可重构计算模块至少包含一个乘累加计算处理阵列,每个乘累加计算处理阵列中包含多个乘累加运算处理单元,每个乘累加运算处理单元配置有各自对应的内部总线,两两乘累加运算处理单元之间通过内部总线互连并与控制总线相连;接口控制器通过控制总线对乘累加运算处理单元之间互联方式及乘累加运算处理单元的分时复用次数进行调度管理。2.根据权利要求1所述的适用于任意维数卷积需求的可重构计算结构,其特征在于,所述的可重构计算模块还包含至少一个加法计算处理阵列,每个加法计算处理阵列中包含多个加法运算处理单元,每个加法运算处理单元配置有各自对应的内部总线;两两加法运算处理单元之间通过内部总线互联,并通过内部总线、控制总线与接口控制器相连。3.一种适用于任意维数卷积需求的可重构计算调度方法,其特征在于,基于权利要求1所述的适用于任意维数卷积需求的可重构计算结构实现,具体包含如下内容:根据卷积计算需求进行运算处理单元重构时,确定功能满足所述卷积计算需求的卷积结果矩阵;依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,选定当前可用计算资源中用于计算的单个运算处理单元,读取卷积结果矩阵中的元素并基于该单个运算处理单元的反复调用分时序贯对卷积结果矩阵中的各个元素进行计算,将元素计算结果反馈至外存主机进行存储,迭代循环,直至完成卷积结果矩阵中所有元素的计算。4.根据权利要求3所述的适用于任意维数卷积需求的可重构计算调度方法,其特征在于,依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,基于当前可用计算资源情况中各个运算处理单元的并行进行配置并选定用于计算的若干运算处理单元,确定卷积结果矩阵中各个元素并行化运算过程中各个元素计算分组及各个元素计算分组与选定的若干运算处理单元之间的对应关系;选定的若干运算处理单元按照预设顺序依次迭代计算相应元素计算分组中的元素并将计算结果反馈至外存主机进行存储,直至计算完该元素计算分组内所有元素,完成卷积结果矩阵中所有元素的计算;其中,优选的,所述的预设顺序为矩阵按行顺序或按列顺序。5.一种适用于任意维数卷积需求的可重构计算方法,其特征在于,基于权利要求2所述的适用于任意维数卷积需求的可重构计算结构实现,具体包含如下内容:根据卷积计算需求进行运算处理单元重构时,确定功能满足所述卷积计算需求的卷积结果矩阵;依据卷积计算效率需求及可重构计算结构中当前可用计算资源情况,基于当前可用计算资源情况中各个乘累加运算处理单元与加法运算处理单元之间的并行组合进行配置并选定用于计算的若干运算处理单元组,确定卷积结果矩阵中各个元素并行化运算过程中各个元素计算分组及各个元素计算分组与选定的若干运算处理单元组之间的对应关系;选定的若干运算处理单元组中按照预设顺序依次迭代计算相应元素计算分组中的元素并将计算结果反馈至外存主机进行存储,直至计算完该元素计算分组内所有元素,完成卷积结果矩阵中所有元素的...

【专利技术属性】
技术研发人员:高彦钊张兴明黄雅静杜延康张文建张帆赵博汤先拓于洪杨堃
申请(专利权)人:中国人民解放军信息工程大学天津市滨海新区信息技术创新中心
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1