图形处理器的数据处理方法、文本处理方法、装置和设备制造方法及图纸

技术编号：25087375 阅读：16 留言：0更新日期：2020-07-31 23:31

本申请提供一种图形处理器的数据处理方法、文本处理方法、装置和设备，属于计算机技术领域。本申请根据一组数据元素的均值的平方与平方均值之间的差值确定该组数据元素的方差。由于根据一组数据元素确定其均值的同时也可以确定其平方均值，确定一组数据元素的均值与确定一组数据元素的平方均值的计算机指令之间不存在依赖关系，因此可以增加图形处理器计算的并行效率，提升均值和方差同时计算的执行速度，缩短数据归一化类操作处理的响应时长，缩短用户的等待时间。

全部详细技术资料下载

【技术实现步骤摘要】
图形处理器的数据处理方法、文本处理方法、装置和设备
本申请涉及计算机
，更具体地说，涉及一种图形处理器的数据处理方法、文本处理方法、装置和设备。
技术介绍
随着人工智能的迅速发展，机器学习和深度学习在为用户提供的各种服务的电子设备中的应用越来越广泛。由于机器学习和深度学习的数据处理的计算量非常庞大，因此需要采用计算速度相对较快的图形处理器对数据进行处理，以提高数据处理速度，缩短数据处理时长。在图形处理器进行机器学习或深度学习的过程中，通常需要对中间数据进行归一化处理，还可能会多次进行数据归一化处理。所以，数据归一化处理的执行速度是影响机器学习或深度学习的整体速度的重要因素。因此，提高数据归一化处理的执行速度，是一个亟待解决的问题。
技术实现思路
为解决现有存在的技术问题，本申请实施例提供一种图形处理器的数据处理方法、文本处理方法、装置和设备，可以提升数据归一化处理的执行速度，缩短使用数据归一化处理的服务的响应时长。为达到上述目的，本申请实施例的技术方案是这样实现的：第一方面，本申请实施例提供一种图形处理器的数据处理方法，包括：图形处理器读取一组数据元素；确定所述一组数据元素的均值、平方均值以及方差，所述方差是根据所述一组数据元素的平方均值与均值的平方之间的差值确定的；根据所述均值和所述方差分别对所述一组数据元素中的每个数据元素进行归一化处理，得到所述一组数据元素对应的一组归一化值；保存得到的一组归一化值。第二方面，本申请实施例提...

【技术保护点】
1.一种图形处理器的数据处理方法，其特征在于，包括：/n图形处理器读取一组数据元素；/n确定所述一组数据元素的均值、平方均值以及方差，所述方差是根据所述一组数据元素的平方均值与均值的平方之间的差值确定的；/n根据所述均值和所述方差分别对所述一组数据元素中的每个数据元素进行归一化处理，得到所述一组数据元素对应的一组归一化值；/n保存得到的一组归一化值。/n

【技术特征摘要】
1.一种图形处理器的数据处理方法，其特征在于，包括：
图形处理器读取一组数据元素；
确定所述一组数据元素的均值、平方均值以及方差，所述方差是根据所述一组数据元素的平方均值与均值的平方之间的差值确定的；
根据所述均值和所述方差分别对所述一组数据元素中的每个数据元素进行归一化处理，得到所述一组数据元素对应的一组归一化值；
保存得到的一组归一化值。

2.根据权利要求1所述的方法，其特征在于，确定所述一组数据元素的均值、平方均值以及方差，包括：
通过一次规约求和操作确定所述一组数据元素的和以及平方和；
根据所述一组数据元素的和以及平方和确定所述一组数据元素的均值、平方均值以及方差，所述均值为所述一组数据元素的和除以所述一组数据元素的个数，所述平方均值为所述一组数据元素的平方和除以所述一组数据元素的个数。

3.根据权利要求1所述的方法，其特征在于，
所述图形处理器读取一组数据元素，包括：所述图形处理器调用多个线程从显存中读取一组数据元素；其中，每个线程分别读取一个或多个数据元素；
所述确定所述一组数据元素的均值、平方均值以及方差，包括：
所述多个线程协同确定所述一组数据元素的和以及平方和；
所述多个线程中的指定线程获得所述均值、平方均值以及方差，所述均值为所述一组数据元素的和除以所述一组数据元素的个数，所述平方均值为所述一组数据元素的平方和除以所述一组数据元素的个数；
根据所述均值和所述方差分别对该组数据元素中的每个数据元素进行归一化处理，包括：
所述指定线程将得到的所述均值和所述方差保存至所述多个线程的共享内存中，并根据所述均值和所述方差对自己读取的数据元素进行归一化处理；
所述多个线程中除指定线程以外的每个线程从所述共享内存中获取均值和方差，并对自己读取的数据元素进行归一化处理；
所述保存得到的一组归一化值，包括：每个线程分别将自己得到的归一化值写入所述显存中。

4.根据权利要求1～3中任一项所述的方法，其特征在于，所述一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素；
所述二维特征矩阵是根据待处理的源数据生成的；所述待处理的源数据为文本数据。

5.根据权利要求1～3中任一项所述的方法，其特征在于，所述方法还包括：
通过应用层接收终端设备发送的文本数据；
通过接口层调用BERT模型的前部分网络层中的卷积运算模块对所述文本数据进行特征提取，得到文本特征矩阵；所述文本特征矩阵包括多个二维特征矩阵；
通过所述接口层调用BERT模型中的归一化处理模块，并通过归一化处理模块采用权利要求1～3中任一项所述的方法分别对各个二维特征矩阵的各组数据元素进行归一化处理，获得归一化处理后的文本特征矩阵，所述各组数据元素中的每一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素；
通过所述接口层调用BERT模型的后部分网络层中的卷积运算模块对归一化处理后的文本特征矩阵进行处理，得到所述文本数据的语义向量；其中，所述前部分网络层为在所述归一化处理模块之前执行的网络层；所述后部分网络层为在所述归一化处理模块之后执行的网络层。

6.一种文本处理方法，其特征在于，包括：
获得目标文本中的各个目标文字组成的文字序列；
获得文本特征矩阵，所述文本特征矩阵包括多个二维特征矩阵，每个二维特征矩阵根据一个目标文字获得；多个二维特征矩阵按照所述文字序列的排列顺序形成所述文本特征矩阵；
采用权利要求1～3中任一项所述的方法分别对各个二维特征矩阵的各组数据元素进行归一化处理，获得归一化处理后的文本特征矩阵，所述各组数据元素中的每一组数据元素为二维特征矩阵中的一行数据元素或一列数据元素；
根据归一化处理后的文本特征矩阵获得所述目标文本的语义向量；
根据所述语义向量获得所述目标文本关联的推荐文本。

7.根据权利要求6所述的方法，其特征在于，所述获得目标文本中的各...

【专利技术属性】
技术研发人员：方佳瑞，赵成舵，于洋，周杰，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人