【技术实现步骤摘要】
基于GPU的编解码模型静态部署方法、电子设备和介质
[0001]本专利技术涉及计算机
,尤其涉及一种基于GPU的编解码模型静态部署方法、电子设备和介质。
技术介绍
[0002]一些编码
‑
解码(Encoder
‑
Decoder)模型(以下简称编解码模型)的输入长度是动态变化的,从而导致输出长度和中间特征长度也是动态变化的,例如语音识别(Automatic Speech Recognition,简称ASR)模型。ASR是AI领域的一项重要应用,是一种将人的语音转换为文本的技术。编解码模型对于推理速度有很高的要求,出于对推理速度的要求,一般需要将训练好的编解码模型部署在图形处理器(Graphics Processing Unit,简称GPU)上使用,一些GPU是支持编解码模型动态部署的,但一些GPU是不支持编解码模型动态部署的,因此,如何实现在GPU上静态部署编解码模型,满足编解码模型对推理速度的要求成为亟待解决的技术问题。
技术实现思路
[0003]本专利技术目的在于,提供一种基于GPU的编解码模型静态部署方法、电子设备和介质,实现了在GPU上静态部署编解码模型,满足了编解码模型对推理速度的要求。
[0004]根据本专利技术第一方面,提供了一种基于GPU的编解码模型静态部署方法,包括:
[0005]步骤S1、获取原始特征矩阵,补齐所述原始特征矩阵的列生成补齐特征矩阵,所述原始特征矩阵的行数和列数均为M,所述补齐特征矩阵的行数为M,列数为N,N&a
【技术保护点】
【技术特征摘要】
1.一种基于GPU的编解码模型静态部署方法,其特征在于,包括:步骤S1、获取原始特征矩阵,补齐所述原始特征矩阵的列生成补齐特征矩阵,所述原始特征矩阵的行数和列数均为M,所述补齐特征矩阵的行数为M,列数为N,N>M;步骤S2、获取补齐特征矩阵对应的相对位置编码矩阵,所述相对位置编码矩阵行数为N
‑
1,列数为M;步骤S3、将所述相对位置编码矩阵输入编解码模型的编码器中生成相对位置编码信息,将所述相对位置编码信息存储在预设的存储器中;步骤S4、将历史预测信息补齐为R位的输入信息,将补齐的R位的输入信息和R位的输入信息中当前有效的信息位数X输入编解码模型的解码器,从所述预设的存储器中读取相对位置编码信息,生成第X+1个预测信息,X的取值范围为0到R
‑
1,基于R
‑
1个预测信息生成目标信息。2.根据权利要求1所述的方法,其特征在于,所述相对位置矩阵中的元素为a
ij
,其中,i为a
ij
的行号,j为a
ij
的列号,i的取值范围为1到M,j的取值范围为1到N
‑
1,将所述相对位置编码矩阵划分为第一区域、第二区域和第三区域;所述第一区域中的元素a
ij
满足:i≤M
‑
1,j<M,且a
ij
位于a
i(i+1)
左侧;所述第二区域中的元素a
ij
满足:i<M
‑
1,2<j≤M,a
ij
位于a
i(i+1)
右侧;所述第三区域中的元素满足j=i+1或者i>M
‑
1;所述步骤S2包括:步骤S21、设置第一矩阵和第二矩阵,所述第一矩阵的和第二矩阵的行数和列数均为M,所述第一矩阵的每一行均为(1,2,3,
…
,m,
…
,M),所述第二矩阵的每一列均为(1,2,3,
…
,m,
…
,M),m的取值范围为1到M;步骤S22、基于第一矩阵和第二矩阵获取第一中间矩阵和第二中间矩阵,所述第一中间矩阵和第二中间矩阵的行数和列数均为M;步骤S23、基于所述第一中间矩阵确定相对位置编码矩阵中的第一区域中的元素,基于所述第二中间矩阵确定第二区域中的元素,将第三区域的元素基于掩码操作全部设置为0,生成所述相对位置矩阵。3.根据权利要求2所述的方法,其特征在于,所述第一矩阵包括元素b
xy
,所述第二矩阵包括元素c
xy
,所述第一中间矩阵包括元素d
xy
,所述第二中间矩阵包括元素e
xy
,x表示b
xy
、c
xy
、d
xy
、e
xy
对...
【专利技术属性】
技术研发人员:谢佳形,
申请(专利权)人:沐曦集成电路杭州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。