图形处理器的数据处理方法、文本处理方法、装置和设备制造方法及图纸

技术编号:25087375 阅读:16 留言:0更新日期:2020-07-31 23:31
本申请提供一种图形处理器的数据处理方法、文本处理方法、装置和设备,属于计算机技术领域。本申请根据一组数据元素的均值的平方与平方均值之间的差值确定该组数据元素的方差。由于根据一组数据元素确定其均值的同时也可以确定其平方均值,确定一组数据元素的均值与确定一组数据元素的平方均值的计算机指令之间不存在依赖关系,因此可以增加图形处理器计算的并行效率,提升均值和方差同时计算的执行速度,缩短数据归一化类操作处理的响应时长,缩短用户的等待时间。

【技术实现步骤摘要】
图形处理器的数据处理方法、文本处理方法、装置和设备
本申请涉及计算机
,更具体地说,涉及一种图形处理器的数据处理方法、文本处理方法、装置和设备。
技术介绍
随着人工智能的迅速发展,机器学习和深度学习在为用户提供的各种服务的电子设备中的应用越来越广泛。由于机器学习和深度学习的数据处理的计算量非常庞大,因此需要采用计算速度相对较快的图形处理器对数据进行处理,以提高数据处理速度,缩短数据处理时长。在图形处理器进行机器学习或深度学习的过程中,通常需要对中间数据进行归一化处理,还可能会多次进行数据归一化处理。所以,数据归一化处理的执行速度是影响机器学习或深度学习的整体速度的重要因素。因此,提高数据归一化处理的执行速度,是一个亟待解决的问题。
技术实现思路
为解决现有存在的技术问题,本申请实施例提供一种图形处理器的数据处理方法、文本处理方法、装置和设备,可以提升数据归一化处理的执行速度,缩短使用数据归一化处理的服务的响应时长。为达到上述目的,本申请实施例的技术方案是这样实现的:第一方面,本申请实施例提供一种图形处理器的数据处理方法,包括:图形处理器读取一组数据元素;确定所述一组数据元素的均值、平方均值以及方差,所述方差是根据所述一组数据元素的平方均值与均值的平方之间的差值确定的;根据所述均值和所述方差分别对所述一组数据元素中的每个数据元素进行归一化处理,得到所述一组数据元素对应的一组归一化值;保存得到的一组归一化值。第二方面,本申请实施例提供一种文本处理方法,包括:获得目标文本中的各个目标文字组成的文字序列;获得文本特征矩阵,所述文本特征矩阵包括多个二维特征矩阵,每个二维特征矩阵根据一个目标文字获得;多个二维特征矩阵按照所述文字序列的排列顺序形成所述文本特征矩阵;采用第一方面的图形处理器的数据处理方法分别对各个二维特征矩阵的各组数据元素进行归一化处理,获得归一化处理后的文本特征矩阵,所述一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素;根据所述文本特征矩阵获得所述目标文本的语义向量;根据所述语义向量获得所述目标文本关联的推荐文本。第三方面,本申请实施例提供一种图形处理器的数据处理装置,包括:数据读取单元,用于读取一组数据元素;数据处理单元,用于确定所述一组数据元素的均值、平方均值以及方差,所述方差是根据所述一组数据元素的平方均值与均值的平方之间的差值确定的;根据所述均值和所述方差分别对所述一组数据元素中的每个数据元素进行归一化处理,得到所述一组数据元素对应的一组归一化值;数据写入单元,用于保存得到的一组归一化值。在一种可选的实施例中,所述一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素;所述二维特征矩阵是根据待处理的源数据生成的;所述待处理的源数据为文本数据。第四方面,本申请实施例提供一种文本处理装置,包括:文本处理单元,用于获得目标文本中的各个目标文字组成的文字序列;获得文本特征矩阵,所述文本特征矩阵包括多个二维特征矩阵,每个二维特征矩阵根据一个目标文字获得;多个二维特征矩阵按照所述文字序列的排列顺序形成所述文本特征矩阵;采用第一方面的方法分别对各个二维特征矩阵的各组数据元素进行归一化处理,获得归一化处理后的文本特征矩阵,所述一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素;根据归一化处理后的文本特征矩阵获得所述目标文本的语义向量;文本推荐单元,用于根据所述语义向量获得所述目标文本关联的推荐文本。在一种可选的实施例中,所述文本处理单元,具体用于:通过应用层接收终端设备发送的目标文本,并获得所述目标文本中的各个目标文字组成的文字序列;通过接口层调用BERT模型的前部分网络层中的卷积运算模块对所述文本数据进行特征提取,得到文本特征矩阵;通过接口层调用BERT模型中的归一化处理模块,并通过归一化处理模块采用第一方面所述的方法分别对各个二维特征矩阵的各组数据元素进行归一化处理;以及通过所述接口层调用BERT模型的后部分网络层中的卷积运算模块对归一化处理后的文本特征矩阵进行处理,得到所述文本数据的语义向量;其中,所述前部分网络层为在所述归一化处理模块之前执行的网络层;所述后部分网络层为在所述归一化处理模块之后执行的网络层。第五方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现第一方面的图形处理器的数据处理或第二方面的文本处理方法。第六方面,本申请实施例还提供一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,实现第一方面的图形处理器的数据处理方法或第二方面的文本处理方法。本申请实施例的图形处理器的数据处理方法、文本处理方法、装置和设备,根据一组数据元素的均值的平方与平方均值之间的差值确定该组数据元素的方差。由于根据一组数据元素确定其均值的同时也可以确定其平方均值,确定一组数据元素的均值与确定一组数据元素的平方均值的计算机指令之间不存在依赖关系,因此可以增加图形处理器计算的并行效率,提升计算均值和方差的执行速度,缩短数据归一化类操作处理的响应时长,缩短用户的等待时间。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种图形处理器的数据处理方法的应用场景示意图;图2为本申请实施例提供的一种图形处理器的数据处理方法的流程示意图;图3为本申请实施例提供的一种文本特征矩阵的流程示意图;图4为本申请实施例提供的一种文本处理方法的流程示意图;图5为本申请实施例提供的一种文本处理方法的应用场景的软件结构框图;图6为本申请实施例提供的一种数据处理方法与相关技术的效果对比图;图7为本申请实施例提供的一种数据处理方法与相关技术相比的加速比的示意图;图8为本申请实施例提供的另一种数据处理方法与相关技术的效果对比图;图9为本申请实施例提供的另一种数据处理方法与相关技术相比的加速比的示意图;图10为本申请实施例提供的一种图形处理器的数据处理装置的结构框图;图11为本申请实施例提供的一种文本处理装置的结构框图;图12为本申请实施例提供的一种电子设备的结构示意图。具体实施方式为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。需本文档来自技高网...

【技术保护点】
1.一种图形处理器的数据处理方法,其特征在于,包括:/n图形处理器读取一组数据元素;/n确定所述一组数据元素的均值、平方均值以及方差,所述方差是根据所述一组数据元素的平方均值与均值的平方之间的差值确定的;/n根据所述均值和所述方差分别对所述一组数据元素中的每个数据元素进行归一化处理,得到所述一组数据元素对应的一组归一化值;/n保存得到的一组归一化值。/n

【技术特征摘要】
1.一种图形处理器的数据处理方法,其特征在于,包括:
图形处理器读取一组数据元素;
确定所述一组数据元素的均值、平方均值以及方差,所述方差是根据所述一组数据元素的平方均值与均值的平方之间的差值确定的;
根据所述均值和所述方差分别对所述一组数据元素中的每个数据元素进行归一化处理,得到所述一组数据元素对应的一组归一化值;
保存得到的一组归一化值。


2.根据权利要求1所述的方法,其特征在于,确定所述一组数据元素的均值、平方均值以及方差,包括:
通过一次规约求和操作确定所述一组数据元素的和以及平方和;
根据所述一组数据元素的和以及平方和确定所述一组数据元素的均值、平方均值以及方差,所述均值为所述一组数据元素的和除以所述一组数据元素的个数,所述平方均值为所述一组数据元素的平方和除以所述一组数据元素的个数。


3.根据权利要求1所述的方法,其特征在于,
所述图形处理器读取一组数据元素,包括:所述图形处理器调用多个线程从显存中读取一组数据元素;其中,每个线程分别读取一个或多个数据元素;
所述确定所述一组数据元素的均值、平方均值以及方差,包括:
所述多个线程协同确定所述一组数据元素的和以及平方和;
所述多个线程中的指定线程获得所述均值、平方均值以及方差,所述均值为所述一组数据元素的和除以所述一组数据元素的个数,所述平方均值为所述一组数据元素的平方和除以所述一组数据元素的个数;
根据所述均值和所述方差分别对该组数据元素中的每个数据元素进行归一化处理,包括:
所述指定线程将得到的所述均值和所述方差保存至所述多个线程的共享内存中,并根据所述均值和所述方差对自己读取的数据元素进行归一化处理;
所述多个线程中除指定线程以外的每个线程从所述共享内存中获取均值和方差,并对自己读取的数据元素进行归一化处理;
所述保存得到的一组归一化值,包括:每个线程分别将自己得到的归一化值写入所述显存中。


4.根据权利要求1~3中任一项所述的方法,其特征在于,所述一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素;
所述二维特征矩阵是根据待处理的源数据生成的;所述待处理的源数据为文本数据。


5.根据权利要求1~3中任一项所述的方法,其特征在于,所述方法还包括:
通过应用层接收终端设备发送的文本数据;
通过接口层调用BERT模型的前部分网络层中的卷积运算模块对所述文本数据进行特征提取,得到文本特征矩阵;所述文本特征矩阵包括多个二维特征矩阵;
通过所述接口层调用BERT模型中的归一化处理模块,并通过归一化处理模块采用权利要求1~3中任一项所述的方法分别对各个二维特征矩阵的各组数据元素进行归一化处理,获得归一化处理后的文本特征矩阵,所述各组数据元素中的每一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素;
通过所述接口层调用BERT模型的后部分网络层中的卷积运算模块对归一化处理后的文本特征矩阵进行处理,得到所述文本数据的语义向量;其中,所述前部分网络层为在所述归一化处理模块之前执行的网络层;所述后部分网络层为在所述归一化处理模块之后执行的网络层。


6.一种文本处理方法,其特征在于,包括:
获得目标文本中的各个目标文字组成的文字序列;
获得文本特征矩阵,所述文本特征矩阵包括多个二维特征矩阵,每个二维特征矩阵根据一个目标文字获得;多个二维特征矩阵按照所述文字序列的排列顺序形成所述文本特征矩阵;
采用权利要求1~3中任一项所述的方法分别对各个二维特征矩阵的各组数据元素进行归一化处理,获得归一化处理后的文本特征矩阵,所述各组数据元素中的每一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素;
根据归一化处理后的文本特征矩阵获得所述目标文本的语义向量;
根据所述语义向量获得所述目标文本关联的推荐文本。


7.根据权利要求6所述的方法,其特征在于,所述获得目标文本中的各...

【专利技术属性】
技术研发人员:方佳瑞赵成舵于洋周杰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1