【技术实现步骤摘要】
本公开的实施例涉及人工智能,更具体地,涉及一种注意力算子的并行计算方法、处理器、电子设备和介质。
技术介绍
1、在人工智能领域,注意力机制在神经网络模型中得到广泛应用。具体的,在注意力机制中,通过注意力算子来发现输入值的注意力权重,得到最终的输出结果。然而,由于注意力算子的运行时间和内存复杂度与序列长度成二次方关系,因此神经网络模型对于长序列输入存在执行时间长、内存开销大等缺陷,如何将待处理的数据进行并行计算分配以充分利用运算单元的计算资源成为重要研究方向。
技术实现思路
1、本公开的实施例提供了一种注意力算子的并行计算方法、处理器、电子设备和介质,用于实现根据处理器的运算单元的数目和张量的形状确定张量的并行分配策略,以使得充分利用处理器中运算单元的计算资源,提高并行计算性能。
2、根据本公开的一方面,提供了一种用于神经网络中注意力算子的并行计算方法,适用于包括t个运算单元的处理器。根据本公开实施例的方法包括:获取要进行并行计算的第一张量,其中,第一张量的形状为[b1, s1,
...【技术保护点】
1.一种用于神经网络中注意力算子的并行计算方法,其特征在于,所述方法适用于包括T个运算单元的处理器,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一张量为所述注意力算子中的查询张量,所述注意力算子包括以下中的一种:快速注意力算子、分组注意力算子。
3. 根据权利要求1所述的方法,其特征在于,所述根据所述处理器的运算单元的数目T、所述第一张量的第一轴的数据维度B1以及所述第一张量的第二轴的数据维度S1,确定将所述第一张量的第一轴的数据分配为M1份以及将所述第一张量的第二轴的数据分配为N1份,以使得M1与N1的乘积等于T包括:
...【技术特征摘要】
1.一种用于神经网络中注意力算子的并行计算方法,其特征在于,所述方法适用于包括t个运算单元的处理器,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一张量为所述注意力算子中的查询张量,所述注意力算子包括以下中的一种:快速注意力算子、分组注意力算子。
3. 根据权利要求1所述的方法,其特征在于,所述根据所述处理器的运算单元的数目t、所述第一张量的第一轴的数据维度b1以及所述第一张量的第二轴的数据维度s1,确定将所述第一张量的第一轴的数据分配为m1份以及将所述第一张量的第二轴的数据分配为n1份,以使得m1与n1的乘积等于t包括:
4.根据权利要求1所述的方法,其特征在于,所述注意力算子为快速注意力算子,所述第一张量为所述快速注意力算子中的查询张量,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述注意力算子为分组注意力算子,所述第一张量为所述分组注意力算子中的查询张...
【专利技术属性】
技术研发人员:请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,
申请(专利权)人:北京壁仞科技开发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。