【技术实现步骤摘要】
【国外来华专利技术】用于深度学习模型的分布式训练的系统和方法相关申请本申请要求美国临时专利申请序列号62/377、094的于2016年8月19日提交的题为“SystemsandMethodsforDistributedTrainingofDeepLearningModels”的权益。美国临时专利申请序列号62/377、094的全部内容通过引用并入本文。
本申请一般涉及机器学习,并且更具体地涉及用于深度学习模型的分布式训练的系统和方法。
技术介绍
深度学习是机器学习的一个分支,它在许多应用中提供最先进的性能,包括计算机视觉、语音处理、自然语言处理和音频识别。深度学习使用类似于大脑中神经元的结构的计算模型。特别地,深度学习的计算模型(下文称为深度学习模型)使用“人工神经元”层来对计算模型的期望功能进行建模。每个人工神经元与一个或多个权重相关联,当人工神经元在聚合体中操作时,可以调整(例如,训练)这些权重以提供期望的功能。可以使用训练数据来训练深度学习模型中的权重。训练数据可以包括输入数据和与输入数据相关联的标记。可以以这样的方式训练(或确定)深度学习模型中的权重:当深度学习模型接收输入数据时,深度学习模型输出对应于输入数据的标记。附图说明当结合以下附图考虑时,参考以下对所公开主题的详细描述,可以更全面地理解所公开的主题的各种目的、特征和优点,其中相同的附图标记表示相同的元件。图1是根据一些实施例的包括主机服务器和多个本地设备的示例分布式深度学习训练平台的框图。图2是根据一些实施例的本地设备的示例实现的框图。图3是表示机器可读指令的流程图,该机器可读指令可以被执行以实现图1和/或图 ...
【技术保护点】
1.一种用于训练深度学习模型的本地设备,所述本地设备包括:参考生成器,其用于标记在所述本地设备处接收的输入数据以生成训练数据;训练器,其用于训练局部深度学习模型并且用于将所述局部深度学习模型发送到服务器,所述服务器用于从多个本地设备接收多个局部深度学习模型,所述服务器用于确定用于全局深度学习模型的一组权重;以及更新器,其用于基于从所述服务器接收的所述一组权重来更新所述局部深度学习模型。
【技术特征摘要】
【国外来华专利技术】2016.08.19 US 62/377,0941.一种用于训练深度学习模型的本地设备,所述本地设备包括:参考生成器,其用于标记在所述本地设备处接收的输入数据以生成训练数据;训练器,其用于训练局部深度学习模型并且用于将所述局部深度学习模型发送到服务器,所述服务器用于从多个本地设备接收多个局部深度学习模型,所述服务器用于确定用于全局深度学习模型的一组权重;以及更新器,其用于基于从所述服务器接收的所述一组权重来更新所述局部深度学习模型。2.如权利要求1所述的本地设备,还包括数据接收器,其用于直接在所述本地设备处接收所述输入数据。3.如权利要求2所述的本地设备,其中,所述输入数据不通过所述服务器。4.如权利要求2所述的本地设备,其中,所述本地设备包括用于收集所述输入数据的传感器。5.如权利要求2所述的本地设备,其中,所述数据接收器通信地耦合到传感器,所述传感器收集所述输入数据并且将所述输入数据发送到所述本地设备。6.如权利要求1所述的本地设备,其中,所述本地设备不将所述输入数据发送到所述服务器。7.如权利要求1所述的本地设备,其中,所述一组权重是基于来自所述多个本地设备的所述多个局部深度学习模型的聚合的权重。8.如权利要求1-7中的一项所述的本地设备,还包括采样控制器,其用于对所述输入数据进行采样。9.如权利要求8所述的本地设备,其中,所述采样控制器用于通过选择所述输入数据的伪随机部分来对所述输入数据进行采样。10.如权利要求8所述的本地设备,其中,所述采样控制器用于通过对所述输入数据进行下采样以减小所述输入数据的数据大小来对所述输入数据进行采样。11.如权利要求1-7中的一项所述的本地设备,其中,所述训练器还用于确定由所述标记确定的标记与所述局部深度学习模型的输出之间的差异。12.如权利要求11所述的本地设备,还包括采样控制器,其用于在所述训练器确定所述差异之前对所述局部深度学习模型的输出进行采样。13.如权利要求11所述的本地设备,其中,所述训练器还用于基于所述差异来调整所述局部深度学习模型。14.一种包括指令的非暂时性计算机可读介质,所述指令在被执行时,使得本地设备至少用于:标记在所述本地设备处接收的输入数据以生成训练数据;训练局部深度学习模型;将所述局部深度学习模型发送到服务器,所述服务器用于从多个本地设备接收多个局部深度学习模型,所述服务器用于确定用于全局深度学习模型的一组权重;以及基于从所述服务器接收的所述一组权重来更新所述局部深度学习模型。15.如权利要求14所述的非暂时性计算机可读介质,其中,所述输入数据是直接在所述本地设备处接收的。16.如权利要求15所述的非暂时性计算机可读介质,其中,所述输入数据不通过所述服务器。17.如权利要求15所述的非暂时性计算机可读介质,其中,所述本地设备包括用于收集所述输入数据的传感器。18.如权利要求15所述的非暂时性计算机可读介质,其中,所述本地设备通信地耦合到传感器,所述传感器收集所述输入数据并且将所述输入数据发送到所述本地设备。19.如权利要求14所述的非暂时性计算机可读介质,其中,所述输入数据不被发送到所述服务器。20.如权利要求14所述的非暂时性计算机可读介质,其中,所述一组权重是基于来自所述多个本地设备的所述多个局部深度学习模型的聚合的权重。21.如权利要求14-20中的一项所述的非暂时性计算机可读介质,其中,所述指令在被执行时,使所述本地设备用于对所述输入数据进行采样。22.如权利要求21所述的非暂时性计算机可读介质,其中,所述指令在被执行时,使所述本地设备用于通过选择所述输入数据的伪随机部分来对所述输入数据进行采样。23.如权利要求21所述的非暂时性计算机可读介质,其中,所述指令在被执行时,使所述本地设备用于通过对所述输入数据进行下采样以减小所述输入数据的数据大小来对所述输入数据进行采样。24.如权利要求14-20中的一项所述的非暂时性计算机可读介质,其中,所述指令在被执行时,使所述本地设备用于确定由所述标记确定的标记与所述局部深度学习模型的输出之间的差异。25.如权利要求24所述的非暂时性计算机可读介质,其中,所述指令在被执行时,使所述本地设备用于在所述本地设备确定所述差异之前对所述局部深度学习模型的输出进行采样。26.如权利要求24所述的非暂时性计算机可读介质,其中,所述指令在被执行时,使所述本地设备用于基于所述差异来调整所述局部深度学习模型。27.一种用于训练深度学习模型的方法,所述方法包括:通过利用在本地设备处的至少一个处理器执行指令,来标记在所述本地设备处接收的输入数据以生成训练数据;通过利用所述至少一个处理器执行指令,来训练局部深度学习模型;将所述局部深度学习模型发送到服务器,所述服务器用于从多个本地设备接收多个局部深度学习模型,所述服务器用于确定用于全局深度学习模型的一组权重;以及通过利用在所述本地设备处的所述至少一个处理器执行指令,来基于从所述服务器接收的所述一组权重来更新所述局部深度学习模型。28.如权利要求27所述的方法,其中,所述输入数据是直接在所述本地设备处接收的。29.如权利要求28所述的方法,其中,所述输入数据不通过所述服务器。30.如权利要求28所述的方法,其中,所述本地设备...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。