一种数据处理方法及装置制造方法及图纸

技术编号：19511542 阅读：52 留言：0更新日期：2018-11-21 07:55

本发明专利技术公开了一种数据处理方法，所述方法包括：从消息队列中获取M个样本数据，M大于等于1，其中，M与工作节点自身的数据处理能力相关联；分别对所述M个样本数据进行计算，得到针对训练模型的M个训练参数；确定所述消息队列中的样本数据为空时，将所述M个训练参数向参数服务器发送。同时，本发明专利技术公开了一种数据处理装置。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及数据处理技术，尤其涉及一种数据处理方法及装置。
技术介绍
在异构环境下使用同步随机梯度下降法(SGD，Synchronous)训练数据时，由每个工作节点对各自分配的样本数据进行并行梯度计算，待每个工作节点完成各自分配的样本数据的梯度计算后，再一起将各自计算得到的梯度参数向参数服务器发送，然后由参数服务器对接收到的所有工作节点上传的梯度参数进行合并和/或累加平均计算，利用得到的针对梯度参数的平均值更新应用到模型。但是，对于异构硬件服务器，各个工作节点的参数指标性能各有不同，性能瓶颈就会出现在性能差的工作节点上，计算较快的工作节点必须等待计算较慢的工作节点对分配的样本数据计算完毕后，才能一起将计算得到的所有梯度参数发送给参数服务器，之后，参数服务器才能利用所有工作节点上传的梯度参数更新当前的训练模型，也才能执行下一轮的更新迭代，如此，现有技术中针对训练模型的梯度更新方法，不仅浪费工作节点的计算力，而且拖慢了针对训练模型的训练时间。
技术实现思路
有鉴于此，本专利技术实施例期望提供一种数据处理方法及装置。为达到上述目的，本专利技术实施例的技术方案是这样实现的：根据本专利技术实施例中的一方面，提供一种数据处理方法，所述方法包括：从消息队列中获取M个样本数据，M大于等于1，其中，M与工作节点自身的数据处理能力相关联；分别对所述M个样本数据进行计算，得到针对训练模型的M个训练参数；确定所述消息队列中的样本数据为空时，将所述M个训练参数向参数服务器发送。上述方案中，所述方法还包括：确定所述消息队列中的样本数据不为空时，利用所述M个训练参数在...

【技术保护点】
1.一种数据处理方法，所述方法包括：从消息队列中获取M个样本数据，M大于等于1，其中，M与工作节点自身的数据处理能力相关联；分别对所述M个样本数据进行计算，得到针对训练模型的M个训练参数；确定所述消息队列中的样本数据为空时，将所述M个训练参数向参数服务器发送。

【技术特征摘要】
1.一种数据处理方法，所述方法包括：从消息队列中获取M个样本数据，M大于等于1，其中，M与工作节点自身的数据处理能力相关联；分别对所述M个样本数据进行计算，得到针对训练模型的M个训练参数；确定所述消息队列中的样本数据为空时，将所述M个训练参数向参数服务器发送。2.根据权利要求1所述方法，所述方法还包括：确定所述消息队列中的样本数据不为空时，利用所述M个训练参数在本地更新所述训练模型的模型参数，得到所述训练模型的M个本地模型参数。3.根据权利要求2所述的方法，确定所述消息队列中的样本数据为空时，将所述M个训练参数向参数服务器发送，包括：确定所述消息队列中的样本数据为空时，计算所述M个本地模型参数之和；将所述M个本地模型参数之和作为训练参数向所述参数服务器发送。4.根据权利要求1所述的方法，从消息队列中获取M个样本数据之前，所述方法还包括：确定工作节点参数、样本数据参数和迭代更新参数；根据所述工作节点参数、所述样本数据参数和所述迭代更新参数之间的乘积，配置所述消息队列的大小。5.根据权利要求1所述的方法，从消息队列中获取M个样本数据，包括：通过远程过程调用RPC接口获取所述消息队列中的M个样本数据。6.一种数据处理装置，所述装置包括：获取...

【专利技术属性】
技术研发人员：向辉，王奇刚，王鹏，胡文晖，李梅，
申请(专利权)人：联想北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人