一种卷积运算协处理器及基于该处理器的快速卷积方法技术

技术编号：29759603 阅读：15 留言：0更新日期：2021-08-20 21:13

本发明专利技术涉及集成电路领域，特别涉及一种卷积运算协处理器及基于该处理器的快速卷积方法，包括接口处理单元，用于接口处理单元解析命令后得到的运算配置参数的配置存储寄存器，用于对接口处理单元转发的初始偏置值进行移位运算、或用于对所述结果存储寄存器进行移位运算以得到最终由所述接口处理单元返回给主处理器的数据移位运算阵列、用于对接口处理单元所转发的待运算数据和结果存储寄存器进行乘积累积运算的MAC阵列以及用于存储所述移位运算阵列对初始偏置值运算得到的结果、也用于存储所述MAC阵列运算得到结果结果存储寄存器；本发明专利技术相比纯软件实现，性能得到很大提高；主处理器使用扩展指令编程协处理器，可以实现非常灵活的计算配置。

全部详细技术资料下载

【技术实现步骤摘要】
一种卷积运算协处理器及基于该处理器的快速卷积方法
本专利技术涉及集成电路领域，特别涉及一种卷积运算协处理器及基于该处理器的快速卷积方法。
技术介绍
集成电路技术的进步不断提升芯片的计算能力，这也加速了很多相关应用技术的发展。人工智能就是这种快速发展的技术之一。机器学习作为人工智能技术的一个主要分支，得益于计算能力的极大发展和信息时代积累起来的大数据，在计算机视觉，自然语言处理，语音识别等领域中取得了丰硕的成果。随着IOT技术的演进，机器学习在边缘侧也得到了广泛的应用，助力边缘侧产品实现关键词识别、图像识别等功能。卷积神经网络是边缘侧的机器学习中最常用的一种模型。边缘侧的卷积神经网络实现可以直接在MCU平台上以纯软件方式实现，但受限于MCU的计算能力，在性能上尚有优化空间。协处理器是一种对主处理器功能的扩展，实现处理特定任务时的性能优化。大多数处理器提供的协处理器接口提供给设计者可自定义的指令扩展，使设计者可以方便的实现易编程的协处理器。
技术实现思路
对卷积神经网络中计算量占比最大的几种运算进行优化，本专利技术提出一种卷积运算协处理器及基于该处理器的快速卷积方法，所述卷积运算协处理器包括接口处理单元、配置存储寄存器、移位运算阵列、MAC阵列以及结果存储寄存器，其中：接口处理单元，用于解析主处理器发出的指令，并根据指令解析结果；将指令中的配置内容存入配置存储寄存器；将指令中的待运算数据转发给MAC阵列；将指令中的初始偏置值转发给移位运算阵列；将运算结果寄存器内容返回给...

【技术保护点】
1.一种卷积运算协处理器，其特征在于，包括接口处理单元、配置存储寄存器、移位运算阵列、MAC阵列以及结果存储寄存器，其中：/n接口处理单元，用于解析主处理器发出的指令，并根据指令解析结果；将指令中的配置内容存入配置存储寄存器；将指令中的待运算数据转发给MAC阵列；将指令中的初始偏置值转发给移位运算阵列；将运算结果寄存器内容返回给主处理器；/n配置存储寄存器，用于接口处理单元解析命令后得到的运算配置参数；/n移位运算阵列，包括多个移位运算器，用于对接口处理单元转发的初始偏置值进行移位运算；或用于对所述结果存储寄存器进行移位运算，以得到最终由所述接口处理单元返回给主处理器的数据；/nMAC阵列，包括多个乘积累加运算器，用于对接口处理单元所转发的待运算数据和结果存储寄存器进行乘积累积运算；/n结果存储寄存器，包括多个寄存器，用于存储所述移位运算阵列对初始偏置值运算得到的结果，也用于存储所述MAC阵列运算得到结果。/n

【技术特征摘要】
1.一种卷积运算协处理器，其特征在于，包括接口处理单元、配置存储寄存器、移位运算阵列、MAC阵列以及结果存储寄存器，其中：
接口处理单元，用于解析主处理器发出的指令，并根据指令解析结果；将指令中的配置内容存入配置存储寄存器；将指令中的待运算数据转发给MAC阵列；将指令中的初始偏置值转发给移位运算阵列；将运算结果寄存器内容返回给主处理器；
配置存储寄存器，用于接口处理单元解析命令后得到的运算配置参数；
移位运算阵列，包括多个移位运算器，用于对接口处理单元转发的初始偏置值进行移位运算；或用于对所述结果存储寄存器进行移位运算，以得到最终由所述接口处理单元返回给主处理器的数据；
MAC阵列，包括多个乘积累加运算器，用于对接口处理单元所转发的待运算数据和结果存储寄存器进行乘积累积运算；
结果存储寄存器，包括多个寄存器，用于存储所述移位运算阵列对初始偏置值运算得到的结果，也用于存储所述MAC阵列运算得到结果。

2.根据权利要求1所述的一种卷积运算协处理器，其特征在于，配置存储寄存器的配置参数包括bias_shift、output_shift及conv_type，其中bias_shift参数用于配置初始偏置值的移位位数，output_shift参数用于配置结果存储寄存器在最后返回给主处理器时的移位位数，conv_type参数用于配置卷积计算的类型。

3.根据权利要求2所述的一种卷积运算协处理器，其特征在于，卷积计算的类型包括depthwise卷积和pointwise卷积。

4.一种基于卷积运算协处理器的快速卷积方法，其...

【专利技术属性】
技术研发人员：常学贵，魏鹏，奚晓明，黄瑜璇，
申请(专利权)人：思澈科技上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人