一种模型训练方法、终端设备及计算机可读存储介质技术

技术编号：33285900 阅读：9 留言：0更新日期：2022-04-30 23:53

本申请公开了一种模型训练方法、终端设备及计算机可读存储介质，该方法包括：读取训练数据集；构建分布式网络模型，其中，分布式网络模型包括若干节点上部署相同的神经网络；将所述训练数据集分配到每个节点上的神经网络进行训练；基于每个节点的神经网络训练得到的模型参数训练最终的分布式网络模型。通过本申请的方法，可以将训练数据集分配到各个节点的神经网络进行训练，减少训练时间，有效提高了模型训练的效率。型训练的效率。型训练的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法、终端设备及计算机可读存储介质

[0001]本申请涉及人工智能
，特别是涉及一种模型训练方法、终端设备及计算机可读存储介质。

技术介绍

[0002]近年来，人工智能领域中的以预训练为代表的自然语言处理技术获得了爆发式发展，新技术和新模型层出不穷。在新时代背景下，如何将多样化的先进的自然语言处理领域科研成果高效地应用到产业实践中并解决实际问题，是自然语言处理领域中的核心问题。机器学习模型是人工智能领域中的关键技术，研发人员通常基于机器学习框架来开展相关工作。
[0003]然而，在将模型应用到产业实践的过程中，复杂的应用场景导致数据量越来越大，传统的模型训练方法训练效率低，不能满足用户对于高效模型训练方法的需求。

技术实现思路

[0004]本申请提供了一种模型训练方法、终端设备及计算机可读存储介质，以解决现有技术中训练效率低的技术问题。
[0005]为解决上述问题，本申请提供的第一个技术方案为：提供一种模型训练方法，所述模型分布于多个节点进行训练，所述模型训练方法包括：
[0006]读取训练数据集；
[0007]构建分布式网络模型，其中，分布式网络模型包括在若干节点上部署相同的神经网络；
[0008]将所述训练数据集分配到每个节点上的神经网络进行训练；
[0009]基于每个节点的神经网络训练得到的模型参数训练最终的分布式网络模型。
[0010]为解决上述技术问题，本申请提供的第二个技术方案为：提供一种终端设备，所述终端设备包括存...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述模型分布于多个节点进行训练，所述模型训练方法包括：读取训练数据集；构建分布式网络模型，其中，分布式网络模型包括在若干节点上部署相同的神经网络；将所述训练数据集分配到每个节点上的神经网络进行训练；基于每个节点的神经网络训练得到的模型参数训练最终的分布式网络模型。2.根据权利要求1所述的模型训练方法，其特征在于，所述将所述训练数据集分配到每个节点上的神经网络进行训练，包括：将所述训练数据集进行切片，以得到与节点数量相同数量的训练数据子集；将若干训练数据子集分配到对应节点上的神经网络进行训练。3.根据权利要求2所述的模型训练方法，其特征在于，所述将若干训练数据子集分配到对应节点上的神经网络进行训练之后，所述模型训练方法还包括：在分配到对应节点的训练数据子集训练完成后，将该节点的训练数据子集分配到其他节点的神经网络继续训练；获取其他节点的训练数据子集，对该节点的神经网络继续训练。4.根据权利要求1所述的模型训练方法，其特征在于，所述基于每个节点的神经网络训练得到的模型参数训练最终的分布式网络模型，包括：将每个节点的神经网络训练得到的模型参数共享到其他节点的神经网络，以使其他节点的神经网络按照多个节点的神经网络的模型参数进行更新。5.根据权利要求1所述的模型训练方法，其特征在于，所述基于每个节点的神经网络训练得到的模型参数训练最终的...

【专利技术属性】
技术研发人员：陶超，周红林，范先旭，彭少杰，龙汉，
申请(专利权)人：深圳市巨鼎医疗股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人