System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种可编程AI实现方法、装置、设备及存储介质制造方法及图纸_技高网

一种可编程AI实现方法、装置、设备及存储介质制造方法及图纸

技术编号:41221231 阅读:2 留言:0更新日期:2024-05-09 23:41
本申请涉及一种可编程AI实现方法、装置、设备及存储介质,应用在AI实现领域,其中方法包括:控制单元根据编码指令生成模型对应的配置信息并烧写,在获取到程序的启动指令时确定使能的算子模块;接口单元将模型数据经由预设的输入缓存区发送至数据转换单元;数据转换单元确定模型数据中的有效数据并提取,对有效数据进行分流;预处理单元读取输出缓存区中的预处理数据,使用使能的算子模块依次对预处理数据进行预处理;AI计算单元对数据进行计算,获取结果数据,将结果数据经由接口单元输出。本申请具有的技术效果是:最大限度地提高了系统的处理效率和资源利用率,实现对数据的针对性处理,可以根据不同模型的特性进行个性化定制。

【技术实现步骤摘要】

本申请涉及ai实现的,尤其是涉及一种可编程ai实现方法、装置、设备及存储介质。


技术介绍

1、随着人工智能的快速发展,ai应用已经涵盖了各行各业,包括自动驾驶、医疗诊断、自然语言处理、图像识别等领域,ai技术的应用不仅提高了工作效率,还为创新性的解决方案开辟了新的可能性。然而,随着ai应用的广泛普及,对于算力、成本和速度等方面的挑战逐渐凸显。

2、传统的ai实现方案通常采用cpu+gpu的组合,其中cpu负责数据预处理和后处理,对整个模型数据先处理完一个算子,然后再对整个模型数据进行下个算子运算;gpu执行深度学习模型的训练和推断,在训练过程中,gpu通过其强大的并行计算能力提升模型的训练速度。

3、然而,由于cpu的处理机制需要反复访问缓存和内存,使得整个模型计算不仅延时很大,而且会长时间占用cpu的负荷;而gpu虽然通过并行计算省去了访问缓存的步骤,但对于算子模块处理同样需要反复读写内存,不可避免增加了处理时长,进而导致现有的ai实现方案整体运算效率较低。


技术实现思路

1、为了提升现有ai实现方案的整体运算效率,本申请提供一种可编程ai实现方法、装置、设备及存储介质。

2、第一方面,本申请提供一种可编程ai实现方法,采用如下的技术方案:所述方法应用于可编程ai实现系统,所述可编程ai实现系统包括控制单元、接口单元、数据转换单元、预处理单元和ai计算单元,所述预处理单元包括若干算子模块,所述方法包括:

3、所述控制单元在获取到目标模型对应的编码指令时,生成所述编码指令对应的配置信息,将所述配置信息烧写至预设的硬件设备中,所述控制单元在获取到所述硬件设备对应程序的启动指令时,基于所述配置信息确定使能的算子模块;

4、所述接口单元在获取到模型数据时,将所述模型数据经由预设的输入缓存区发送至所述数据转换单元;

5、所述数据转换单元基于所述编码指令,确定所述模型数据中的有效数据并提取,对所述有效数据进行分流生成预处理数据和非预处理数据,将所述预处理数据发送至所述预处理单元,将所述非预处理数据发送至预设的输出缓存区;

6、所述预处理单元读取所述输出缓存区中的预处理数据,使用所述使能的算子模块依次对所述预处理数据进行预处理;

7、所述ai计算单元对预处理完成的所述预处理数据和所述非预处理数据进行计算,获取结果数据,将所述结果数据经由所述接口单元输出。

8、在一个具体的可实施方案中,所述预处理单元还包括寄存器模块,所述基于所述配置信息确定使能的所述算子模块包括:

9、所述控制单元将所述配置信息发送至所述预处理单元的寄存器模块;

10、所述预处理单元控制所述寄存器模块对所述配置信息进行解析,确定使能的算子模块。

11、在一个具体的可实施方案中,所述算子模块之间的数据传输接口为valid和ready;所述寄存器模块的配置接口为axi lite;所述预处理单元读取所述输出缓存区中的预处理数据之后,还包括:

12、所述预处理单元根据所述算子模块的实时计算状态确定所述算子模块对前级所述算子模块的数据接收形式,所述数据接收形式包括接收前级数据和反压前级数据。

13、在一个具体的可实施方案中,在所述对所述有效数据进行分流生成预处理数据和非预处理数据之后,还包括:

14、所述数据转换单元基于所述配置信息,对所述有效数据执行数据转换处理,所述数据转换处理包括矩阵相乘、行列转换和tile读取。

15、在一个具体的可实施方案中,所述使用所述使能的算子模块依次对所述预处理数据进行预处理之后,还包括:

16、所述预处理单元将预处理完成的所述预处理数据经由所述接口单元发送至外部设备。

17、在一个具体的可实施方案中,所述ai计算单元对预处理完成的所述预处理数据和所述非预处理数据进行计算,获取结果数据包括:

18、所述ai计算单元对预处理完成的所述预处理数据和所述非预处理数据进行计算,获取计算完成的待验证数据,确定所述待验证数据是否符合预设标准;

19、若符合所述标准,则所述ai计算单元将所述待验证数据确定为结果数据;否则,将所述待验证数据发送至所述输出缓存区,供所述数据转换单元提取和处理,直至符合所述标准。

20、在一个具体的可实施方案中,所述ai计算单元包括由若干ai engine tile组成的二位阵列;

21、所述ai engine tile包括ai engine、储存模块和互联模块;

22、所述ai engine为超长指令字处理器,所述ai engine包括标量子模块、矢量子模块、加载子模块和存储子模块;

23、所述ai计算单元的主要算力由所述矢量子模块提供。

24、第二方面,本申请提供一种可编程ai实现装置,采用如下技术方案:所述装置应用于可编程ai实现系统,所述可编程ai实现系统包括控制单元、接口单元、数据转换单元、预处理单元和ai计算单元,所述预处理单元包括若干算子模块,所述装置包括:

25、使能算子确定模块,用于在获取到目标模型对应的编码指令时,生成所述编码指令对应的配置信息,将所述配置信息烧写至预设的硬件设备中,在获取到所述硬件设备对应程序的启动指令时,基于所述配置信息确定使能的算子模块;

26、模型数据传输模块,用于在获取到模型数据时,将所述模型数据经由预设的输入缓存区发送至所述数据转换单元;

27、模型数据转换模块,用于基于所述编码指令,确定所述模型数据中的有效数据并提取,对所述有效数据进行分流生成预处理数据和非预处理数据,将所述预处理数据发送至所述预处理单元,将所述非预处理数据发送至预设的输出缓存区;

28、数据预处理模块,用于读取所述输出缓存区中的预处理数据,使用所述使能的算子模块依次对所述预处理数据进行预处理;

29、模型数据计算模块,用于对预处理完成的所述预处理数据和所述非预处理数据进行计算,获取结果数据,将所述结果数据经由所述接口单元输出。

30、第三方面,本申请提供一种计算机设备,采用如下技术方案:包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如上述任一种可编程ai实现方法的计算机程序。

31、第四方面,本申请提供一种计算机可读存储介质,采用如下技术方案:存储有能够被处理器加载并执行上述任一种可编程ai实现方法的计算机程序。

32、综上所述,本申请具有以下有益技术效果:

33、1、通过编程确定预处理中使能的算子模块,可以根据特定的应用场景和目标模型需求,动态的选择哪些算子模块需要在预处理过程中工作,哪些算子模块不需要,减少了不必要算子模块在预处理过程中的资源浪费,实现了动态调整系统配置的目的,从而最大限度地提高了系统的处理效率和资源利用率;

34、2、通过使能的算子模块依次处理预处理数据本文档来自技高网...

【技术保护点】

1.一种可编程AI实现方法,其特征在于,所述方法应用于可编程AI实现系统,所述可编程AI实现系统包括控制单元、接口单元、数据转换单元、预处理单元和AI计算单元,所述预处理单元包括若干算子模块,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述预处理单元还包括寄存器模块,所述基于所述配置信息确定使能的所述算子模块包括:

3.根据权利要求2所述的方法,其特征在于,所述算子模块之间的数据传输接口为valid和ready;所述寄存器模块的配置接口为AXI Lite;所述预处理单元读取所述输出缓存区中的预处理数据之后,还包括:

4.根据权利要求1所述的方法,其特征在于,在所述对所述有效数据进行分流生成预处理数据和非预处理数据之后,还包括:

5.根据权利要求1所述的方法,其特征在于,所述使用所述使能的算子模块依次对所述预处理数据进行预处理之后,还包括:

6.根据权利要求1所述的方法,其特征在于,所述AI计算单元对预处理完成的所述预处理数据和所述非预处理数据进行计算,获取结果数据包括:

7.根据权利要求1所述的方法,其特征在于,所述AI计算单元包括由若干AI EngineTile组成的二位阵列;

8.一种可编程AI实现装置,其特征在于,所述装置应用于可编程AI实现系统,所述可编程AI实现系统包括控制单元、接口单元、数据转换单元、预处理单元和AI计算单元,所述预处理单元包括若干算子模块,所述装置包括:

9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。

10.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。

...

【技术特征摘要】

1.一种可编程ai实现方法,其特征在于,所述方法应用于可编程ai实现系统,所述可编程ai实现系统包括控制单元、接口单元、数据转换单元、预处理单元和ai计算单元,所述预处理单元包括若干算子模块,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述预处理单元还包括寄存器模块,所述基于所述配置信息确定使能的所述算子模块包括:

3.根据权利要求2所述的方法,其特征在于,所述算子模块之间的数据传输接口为valid和ready;所述寄存器模块的配置接口为axi lite;所述预处理单元读取所述输出缓存区中的预处理数据之后,还包括:

4.根据权利要求1所述的方法,其特征在于,在所述对所述有效数据进行分流生成预处理数据和非预处理数据之后,还包括:

5.根据权利要求1所述的方法,其特征在于,所述使用所述使能的算子模块依次对所述预处理数据进...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:深存科技无锡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1