用于处理张量数据的方法和装置制造方法及图纸

技术编号：42491418 阅读：28 留言：0更新日期：2024-08-21 13:08

本公开的实施例公开了一种用于处理张量数据的方法、用于处理张量数据的装置、电子设备与计算机可读存储介质。该方法包括：响应于张量数据在第一轴上的数据长度大于预设阈值，确定第一轴对应的调整倍数；调整张量数据的形状，其中，调整形状后的张量数据在第一轴上的数据长度缩短调整倍数并且在第二轴上的数据长度扩大调整倍数，其中，调整形状后的张量数据在第一轴上的数据长度小于预设阈值；在内存中排布调整形状后的张量数据；以及基于调整倍数，将内存中排布的所述张量数据，按照数据块的粒度加载至计算单元中进行计算。本公开能够在算子的输入数据在某个轴上的长度超过硬件限制时，人工智能芯片仍能高效地处理算子的计算。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能、更具体地涉及一种用于处理张量数据的方法、用于处理张量数据的装置、电子设备与存储介质。

技术介绍

1、目前，人工智能芯片正在飞速发展，并已广泛应用于各个领域。例如，在计算机视觉（cv）领域，人工智能能够执行图像分类、目标检测、语义分割等任务。而在自然语言处理（nlp）领域，人工智能可实现机器翻译、文本分类、情感分析等功能。特别是大语言模型的提出，极大地优化了这些任务的执行效果。

2、无论是在计算机视觉领域还是在自然语言处理领域，搭载大语言模型的人工智能芯片都需要处理高分辨率图像或超长文本和语音数据。然而，大语言模型中的注意力机制通常依赖特定算子来实现。这些算子的运行效率在很大程度上受到人工智能芯片中gpu内存设计特点的影响。通常来讲，不论如何更改人工智能芯片的布局，其最终都会对张量（tensor）在内存中的排布进行限制。而张量在内存中的排布的任何限制都可能导致将人工智能在处理大分辨率图像或超长文本和语音数据时，算子（尤其是实现注意力机制的算子）的性能下降。

3、具体而言，在计算机视觉场景中，处理...

【技术保护点】

1.一种用于处理张量数据的方法，包括：

2. 如权利要求1所述的方法，其中，所述调整所述张量数据的形状包括：

3. 如权利要求2所述的方法，其中，所述基于所述调整倍数，将所述内存中排布的所述张量数据，按照数据块的粒度加载至计算单元中进行计算包括：

4. 如权利要求3所述的方法，其中所述张量数据为查询张量，所述基于所述调整倍数和所述子张量在第二轴上的数据长度，确定待计算的数据块在所述内存中的位置还包括：

5.如权利要求4所述的方法，所述基于所述待计算的数据块在所述内存中的位置，将所述数据块加载至计算单元中进行计算还包括：</p>

6.如权...

【技术特征摘要】

1.一种用于处理张量数据的方法，包括：

2. 如权利要求1所述的方法，其中，所述调整所述张量数据的形状包括：

3. 如权利要求2所述的方法，其中，所述基于所述调整倍数，将所述内存中排布的所述张量数据，按照数据块的粒度加载至计算单元中进行计算包括：

5.如权利要求4所述的方法，所述基于所述待计算的数据块在所述内存中的位置，将所述数据块加载至计算单元中进行计算还包括：

6.如权利要求3所述的方法，其中所述张量数据为键张量或值张量，所述基于所述调整倍数和所述子张量在第二轴上的数据长度，确...

【专利技术属性】
技术研发人员：请求不公布姓名，请求不公布姓名，请求不公布姓名，请求不公布姓名，请求不公布姓名，请求不公布姓名，
申请(专利权)人：北京壁仞科技开发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人