一种DNN算子库动态数据分块方法技术

技术编号：32753092 阅读：10 留言：0更新日期：2022-03-23 18:48

本发明专利技术公开一种DNN算子库动态数据分块方法，包括以下步骤：S1、用户调用所需算子，并传入一组由多个整数组成的参数，作为S2的输入；S2、根据S1中获取的参数大小和算法的参数适用范围，将一组参数划分为多组参数，并为各组参数选择不同的算法进行处理；S3、从S2获得参数，根据算法特点，为参数中各个维度[N,H,W,C]的数据设置优先级；S4、在保证内存充裕的前提下，将[N,H,W,C]按照参数中各个数据的优先级从高到低的顺序，依次增加其分块的大小；S5、将动态选择好的数据分块传递给对应的算法，调用算法，得出结果。本发明专利技术保证了算子性能的最佳发挥，不需要用户担忧众多算法如何抉择的问题，具有良好的用户体验。具有良好的用户体验。具有良好的用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种DNN算子库动态数据分块方法

[0001]本专利技术涉及一种DNN算子库动态数据分块方法，属于深度学习

技术介绍

[0002]近年来，人工智能的迅速发展将深刻改变世界发展模式和人类生活方式，为抢抓人工智能发展重大战略机遇，各国均在构筑先发优势，当前阶段人工智能发展的主流技术路线是以模型学习驱动的数据智能。DNN算子库是针对人工智能深度学习的基础，每一种算子都有多种实现算法，不同的算法在不同的用例参数下各有优势，各架构计算能力强大，但带宽资源还无法满足计算的需求，因此带宽资源显得异常珍贵。如何将众多的算法协调开来，保证用户使用算子时，根据用户参数实时确保任务分块在系统当前状态下最优并能够调用最佳的算法，是充分利用系统带宽资源的关键，对提升算子的性能具有重要的意义。
[0003]目前，DNN算子库每种算子的优化算法多种多样，用户在使用时，无法实时动态调整任务分块大小，而且不能够实时选取最优的任务分块，只能使用固定大小的任务分块，模糊调用可能最优的算法，导致用户体验差，不够友好，而且不能充分发挥算子的最佳性能。
[0004]DNN算子库是针对人工智能的底层算力支撑库，对每一种算子都有多种实现算法，且每种算法有多种数据分块选择。用户参数是实时给出的，如何通过用户参数，实现对算子库里众核算法的最合理调用，实现算子效力最大化，是个亟需解决的问题。

技术实现思路

[0005]本专利技术的目的是提供一种DNN算子库动态数据分块方法，其保证了算子性能的最佳发挥，不需要用户担忧众多算法如何抉...

【技术保护点】

【技术特征摘要】
1.一种DNN算子库动态数据分块方法，其特征在于，包括以下步骤：S1、用户调用所需算子，并传入一组由多个整数组成的参数，作为S2的输入；S2、根据S1中获取的参数大小和算法的参数适用范围，将一组参数划分为多组参数，并为各组参数选择不同的算法进行处理，根据算法特点将参数划分为适合各个算法处理的大小，并将参数分配给不同的算法；S3、从S2获得参数，根据算法特点，为参数中各个维度[N,H,W,C]的数据设置优...

【专利技术属性】
技术研发人员：孙强，林蓉芬，史俊达，袁欣辉，何王全，魏迪，孙浩男，
申请(专利权)人：无锡江南计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人