信息处理设备、信息处理方法及计算机可读记录介质技术

技术编号:26479580 阅读:79 留言:0更新日期:2020-11-25 19:24
本公开涉及信息处理设备、信息处理方法及计算机可读记录介质。多个操作装置中的每个操作装置向表示神经网络并且包括共同的第一权重的模型输入与由其他操作装置使用的第一数据不同的第一数据,计算针对第一权重的误差梯度,并且对由每个操作装置计算出的梯度进行合并。每个操作装置将第一权重存储在存储装置中并且基于与由其他操作装置使用的超参数值不同的超参数值、经合并的误差梯度和第一权重将模型的权重更新为第二权重。每个操作装置将共同的第二数据输入至模型,比较由每个操作装置获取的评估结果,并且选择共同的超参数值。每个操作装置基于所选择的超参数值、经合并的误差梯度和存储在存储装置中的第一权重将模型的权重更新为第三权重。

【技术实现步骤摘要】
信息处理设备、信息处理方法及计算机可读记录介质
本文讨论的实施方式涉及信息处理设备、信息处理方法和程序。
技术介绍
机器学习作为计算机辅助数据分析来执行。在机器学习中,将指示具有已知结果的多个样本的数据输入至计算机。计算机分析该数据并且生成归纳原因(其可以被称为解释变量或自变量)与结果(其可以被称为目标变量或因变量)之间的关系的模型。所生成的模型用于预测未知结果。例如,计算机对包括指示这些图像中的对象的种类的训练标签的多个图像进行分析并且生成根据图像确定对象的种类的图像识别模型。存在使用神经网络(NN)作为模型的机器学习。典型的神经网络包括输入层、输出层和至少一个中间层,并且在这些层中的每个层中布置多个节点。属于相邻层的两个节点经由加权边(weightededge)彼此连接。单个节点表示神经元,并且单个边表示突触。输入至输入层的解释变量的值基于边权重被传播至下游层,并且目标变量的值从输出层输出。通过调整这些权重,神经网络能够近似各种函数。包括许多中间层的神经网络可以被称为深度神经网络(DNN),并且使用深度神经网络的机器学习可以被称为深本文档来自技高网...

【技术保护点】
1.一种信息处理设备,包括:/n多个操作装置;以及/n对应于所述多个操作装置的多个存储装置,/n其中,所述多个操作装置中的每个操作装置:/n向表示神经网络并且包括所述多个操作装置之间共同的第一权重的模型输入与由其他操作装置使用的第一数据不同的第一数据,基于所述模型的输出计算针对所述第一权重的误差梯度,并且对所述误差梯度和由所述其他操作装置计算出的其他误差梯度进行合并以获得经合并的误差梯度,/n将所述第一权重存储在所述多个存储装置中的对应存储装置中并且基于与由所述其他操作装置使用的超参数值不同的超参数值、所述经合并的误差梯度和所述第一权重将所述模型的权重更新为第二权重,/n将所述多个操作装置之间...

【技术特征摘要】
20190523 JP 2019-0971391.一种信息处理设备,包括:
多个操作装置;以及
对应于所述多个操作装置的多个存储装置,
其中,所述多个操作装置中的每个操作装置:
向表示神经网络并且包括所述多个操作装置之间共同的第一权重的模型输入与由其他操作装置使用的第一数据不同的第一数据,基于所述模型的输出计算针对所述第一权重的误差梯度,并且对所述误差梯度和由所述其他操作装置计算出的其他误差梯度进行合并以获得经合并的误差梯度,
将所述第一权重存储在所述多个存储装置中的对应存储装置中并且基于与由所述其他操作装置使用的超参数值不同的超参数值、所述经合并的误差梯度和所述第一权重将所述模型的权重更新为第二权重,
将所述多个操作装置之间共同的第二数据输入至所述模型,评估所述模型的输出的精度,将所述精度的评估结果与由所述其他操作装置获取的评估结果进行比较,并且选择所述多个操作装置之间共同的超参数值,以及
基于所选择的超参数值、所述经合并的误差梯度和存储在所述对应存储装置中的所述第一权重将所述模型的权重更新为第三权重。


2.根据权利要求1所述的信息处理设备,其中,在与所述多个操作装置相对应的多个超参数值中,与实现了最高输出精度的操作装置相对应的超参数值被选择为所述多个操作装置之间共同的超参数值。


3.根据权利要求1所述的信息处理设备,其中,与由所述其他操作装置使用的超参数值不同的超参数值是通过将与由所述其他操作装置使用的调整系数不同的调整系数应用于所述多个操作装置之间共同的超参数基本值来生成的。


4.根据权利要求1所述的信息处理设备,其中,
向由所述多个操作装置中的每个操作装置执行的过程分配标识信息,
与由所述其他操作装置使用的超参数值不同的超参数值是根据分配给对应过程的标识信息来确定的,并且
所述多个操作装置之间共同的标识信息中的一项是基于所述精度的评估结果与由所述其他操作装置获取的评估结果之间的比较来选择的,并且所述多个操作装置之间共同的超参数值是根据所选择的标识信息中的一项来确定的。


5.根据权利要求1所述的信息处理设备,其中,
所述模型包括多个第一权重,并且
以并行方式执行:针对所述多个第一...

【专利技术属性】
技术研发人员:笠置明彦田渕晶大山崎雅文
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1