一种基于并行加速循环体的性能语义加速机制及其应用制造技术

技术编号:23162272 阅读:30 留言:0更新日期:2020-01-21 22:05
本发明专利技术适用于加速机制技术改进领域,提供了一种基于并行加速循环体的性能语义加速机制,所述性能语义加速机制包括:S1、观察计算和数据密集型的ML算法查找出其共同模式;S2、将找出的共同模式抽象成与性能相关的程序行为构成性能语义;S3、对性能语义进行加速形成通用加速机制。该性能语义加速机制通过调用其库函数来编写的算法,并且代码将被编译为硬件API进行库调用。简化了程序员每次都需要队ML算法的架构,节省了时间,提高了效率。

【技术实现步骤摘要】
一种基于并行加速循环体的性能语义加速机制及其应用
本专利技术属于加速机制技术改进领域,尤其涉及一种基于并行加速循环体的性能语义加速机制及其应用。
技术介绍
机器学习(ML)的日益普及及其非凡的计算需求共同引发了对ML应用的硬件加速器设计的广泛研究[1]。与通用架构相比,这些加速器在性能改进方面达到了1-2个数量级。在当前的智能手机中,用于神经网络加速的NPU协处理器已成为应用处理器的组成部分。然而,目前ML加速器仍然基于定制设计,这是昂贵的,费力的,并且最严重的是,具有非常有限的可重新定位性。实质上,只有具有巨大市场容量的ML算法才能通过定制设计为加速器付出努力,并且为每类ML算法设置专用加速器是不切实际的。[1].V.Sze,Y.Chen,T.YangandJ.S.Emer,"EfficientProcessingofDeepNeuralNetworks:ATutorialandSurvey,"inProceedingsoftheIEEE,vol.105,no.12,pp.2295-2329,Dec.2017。r>[2].Chen本文档来自技高网...

【技术保护点】
1.一种基于并行加速循环体的性能语义加速机制,其特征在于,所述性能语义加速机制包括:/nS1、观察计算和数据密集型的ML算法查找出其共同模式;/nS2、将找出的共同模式抽象成与性能相关的程序行为构成性能语义;/nS3、对性能语义进行加速形成通用加速机制。/n

【技术特征摘要】
1.一种基于并行加速循环体的性能语义加速机制,其特征在于,所述性能语义加速机制包括:
S1、观察计算和数据密集型的ML算法查找出其共同模式;
S2、将找出的共同模式抽象成与性能相关的程序行为构成性能语义;
S3、对性能语义进行加速形成通用加速机制。


2.根据权利要求1所述的性能语义加速机制,其特征在于,所述步骤S2中性能语义可映射到许多具体的功能语义上,并通过为抽象提供简单的配置信息,将抽象还原到特定功能。


3.根据权利要求2所述的性能语义加速机制,其特征在于,所述加速机制在使用中直接调取其中的软件函数逻辑形成一个配置虚化的硬件框架。


4.根据权利要求3所述的性能语义加速机制,其特征在于,所述加速机制主要来自跨多个循环的带的操作的并行化,通过计算并行度和数据来源给出基本操作Result=Source1opSource2,其中,op是一种操作。


5.根据权利要求4所述的性能语义加速机制,其特征在于,所述计算并行度中虚幻爹地啊中结果依赖性决定了可用于加速的并行性,并将并行性分为以下三种类型:

【专利技术属性】
技术研发人员:李险峰王元洵
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1