【技术实现步骤摘要】
序列处理方法、序列处理装置及存储介质
本公开涉及计算机
,尤其涉及一种序列处理方法、序列处理装置及存储介质。
技术介绍
神经网络可认为一种参数化的复杂非线性函数,而其参数通常是一些数据结构为张量(Tensor)的数组。利用神经网络可以处理例如语音识别、手写文字识别、自然语言处理等序列处理任务。由于图形处理器(GraphicsProcessingUnit,GPU)能够进行的算法有限,导致处理序列的效率低下,进而在执行序列识别任务时,通常采用中央处理器(centralprocessingunit,CPU)进行处理。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种序列处理方法、序列处理装置及存储介质。根据本公开实施例的第一方面,提供一种序列处理方法,应用于图形处理器GPU,所述序列处理方法包括:确定待处理序列,所述待处理序列具有不规则张量数据结构。确定所述待处理序列包括的数据结构信息,所述数据结构信息包括张量维度、每一维度的张量中包括的元素信息。基于所述张量维度以及所述元素信息,将所述不规则张量数据结构转换为规则张量数据结构。基于所述规则张量数据结构,对所述待处理序列进行处理。在一些实施例中,所述基于所述张量维度以及所述元素信息,将所述不规则张量数据结构转换为规则张量数据结构,包括:响应于在所述不规则张量数据结构中包括N个所述张量维度的情况下,则基于所述元素信息,将所述不规则张量数据结构转换为N-1个规则数组对。在另一些实施例中,所述基于所述元素信息,将所述不规则 ...
【技术保护点】
1.一种序列处理方法,其特征在于,应用于图形处理器GPU,所述序列处理方法包括:/n确定待处理序列,所述待处理序列具有不规则张量数据结构;/n确定所述待处理序列包括的数据结构信息,所述数据结构信息包括张量维度、每一维度的张量中包括的元素信息;/n基于所述张量维度以及所述元素信息,将所述不规则张量数据结构转换为规则张量数据结构;/n基于所述规则张量数据结构,对所述待处理序列进行处理。/n
【技术特征摘要】 【专利技术属性】
1.一种序列处理方法,其特征在于,应用于图形处理器GPU,所述序列处理方法包括:
确定待处理序列,所述待处理序列具有不规则张量数据结构;
确定所述待处理序列包括的数据结构信息,所述数据结构信息包括张量维度、每一维度的张量中包括的元素信息;
基于所述张量维度以及所述元素信息,将所述不规则张量数据结构转换为规则张量数据结构;
基于所述规则张量数据结构,对所述待处理序列进行处理。
2.根据权利要求1所述的序列处理方法,其特征在于,所述基于所述张量维度以及所述元素信息,将所述不规则张量数据结构转换为规则张量数据结构,包括:
在所述不规则张量数据结构中包括N个所述张量维度的情况下,基于所述元素信息,将所述不规则张量数据结构转换为N-1个规则数组对。
3.根据权利要求2所述的序列处理方法,其特征在于,所述基于所述元素信息,将所述不规则张量数据结构转换为N-1个规则数组对,包括:
根据所述元素信息,确定所述不规则张量数据结构中包括的元素数目;
确定所述规则数组对中包括的第一数组,所述第一数组中的元素值为所述不规则张量数据结构中包括的元素,且所述第一数组的数组长度为所述不规则张量数据结构中包括的元素数目;
基于所述第一数组,确定所述规则数组对中包括的第二数组和/或第三数组;
其中,所述第二数组用于表征所述第一数组中包括的每个所述元素在所述不规则张量数据结构中所属行信息;
所述第三数组用于表征所述不规则张量数据结构中每一行所包含的所述元素在所述第一数组中的起始位置,以及所述第一数组的数组长度。
4.根据权利要求3所述的序列处理方法,其特征在于,基于所述第一数组,确定所述规则数组对中包括的第二数组,包括:
确定所述第一数组中每一元素值在所述不规则张量数据结构中所属的行值;
将所述行值作为第二数组中每一行对应的元素值,形成数组长度为所述不规则张量数据结构中包括的元素数目的第二数组。
5.根据权利要求3所述的序列处理方法,其特征在于,基于所述第一数组,确定所述规则数组对中包括的第三数组,包括:
确定所述不规则张量数据结构中各行中的行起始元素,并确定所述行起始元素在所述第一数组中对应的行值;
将所述行起始元素在所述第一数组中对应的行值,按照行顺序,作为第三数组中包括的元素值,并将所述第一数组的数组长度作为所述第三数组的最后一个元素值。
6.根据权利要求5所述的序列处理方法,其特征在于,在所述第三数组中当前行对应的所述行起始元素为空的情况下,将所述第三数组中相邻行的元素值作为当前行的元素值。
7.根据权利要求1至6中任意一项所述的序列处理方法,其特征在于,
在确定所述待处理序列之前,所述方法还包括:
确定序列处理任务,所述序列处理任务为控制所述图形处理器GPU执行序列处理的任务;
所述确定待处理序列,包括:
响应于所述序列处理任务中存在有限状态接收器,确定所述有限状态接收器中包括的状态数目,以及每一状态对应的弧数据结构;
基于所述状态数目以及所述状态对应的弧,使用具有不规则张量数据结构的序列表征所述有限状态接收器,得到所述待处理序列;
其中,所述不规则张量数据结构中的行数由所述状态数目确定,每一行中包括的所述元素基于所述状态中的弧数据结构确定。
8.根据权利要求7所述的序列处理方法,其特征在于,所述每一行中包括的元素,采用如下方式基于状态中的弧数据结构确定:
将弧数据结构中包括的起始状态、目标状态、输入标签以及标签权重,确定为每一行中包括的元素。
9.根据权利要求7或8所述的序列处理方法,其特征在于,所述序列处理方法还包括:
响应于所述序列处理任务中存在有限状态转换器,将所述有限状态转换器的输出标签,作为所述有限状态接收器的附加属性生成第四数组;
所述第四数组中包括的元素数目与所述状态接收器中包括的弧数据结构数量相同。
10.根据权利要求7至9中任意一项所述的序列处理方法,其特征在于,所述序列处理方法还包括:
基于所述规则张量数据结构,创建有限状态转换器输入标签与输出标签之间的映射关系,并保存所述映射关系。
11.一种序列处理装置,其特征在于,应用于图形处理器GPU,所述序列处理装置包括:
确定单元,用于确定待处理序列,以及确定所述待处理序列包括的数据结构信息,其中,所述待处理序列具有不规则张量数据结构,所述数据结构信息包括张量维度、每一维度的张量中包括的元素信息;
技术研发人员:丹尼尔·波维,仇浩文,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。