计算机可读记录介质、信息处理方法和信息处理装置制造方法及图纸

技术编号：36066473 阅读：15 留言：0更新日期：2022-12-24 10:33

提供了计算机可读记录介质、信息处理方法和信息处理装置。使计算机执行以下处理：在深度学习中，检测与使用特定位数执行的运算相比使用较低位数执行的运算中的学习失败的征兆；回滚至检测到征兆的运算，并且通过使用特定位数的运算执行重新计算；确定是否允许从使用特定位数的运算返回至使用较低位数的运算；并且当允许返回至使用较低位数的运算时，切换至使用较低位数的运算。用较低位数的运算。用较低位数的运算。

全部详细技术资料下载

【技术实现步骤摘要】
计算机可读记录介质、信息处理方法和信息处理装置

[0001]本文所讨论的实施方式涉及计算机可读记录介质、信息处理方法和信息处理装置。

技术介绍

[0002]近年来，在用于实现高速机器学习的技术中，运算精度优化技术已经引起了人们的注意。虽然通常使用32位浮点数(floating
‑
point number)进行机器学习中的运算，但是在一些情况下，较少的位数足以解决使用机器学习的问题。当使用较少的位数执行运算时，得到诸如更高的计算速度、改进的功率性能和节省存储器资源的益处。
[0003]目前，许多公司正在努力开发或应用运算精度优化技术。例如，已知用于通过在图形处理单元(GPU)上使用8位或16位浮点数来以较少位数执行运算的技术。还已知通过使用张量处理单元(TPU)用8位整数执行推理的技术，TPU是专用于张量运算的处理器。
[0004]在这些背景下，已经提出了根据机器学习中的阶段来改变定点表示，以最佳精度水平执行运算的处理器。该处理器被设计成特别专用于深度学习，一种机器学习的类型，并且根据训练的进度利用深度学习所具有的特性来优化运算精度。这些特性是“在迭代和下一次迭代之间计算的数值之间的变化越来越小”和“张量具有的值的分布越来越窄”。在这里，一次迭代对应于机器学习中的一次重复。
[0005]在学习中，使用常规使用的32位浮点格式的训练在学习的前半部分(下文中可以称为“预学习”)期间进行，其中迭代与下一次迭代之间的数值变化以及张量所具有的值的变化幅度相对较大。使用可改变小数点位置的8...

【技术保护点】

【技术特征摘要】
1.一种存储有程序的计算机可读记录介质，所述程序使计算机执行处理，所述处理包括：在深度学习中，检测与使用特定位数执行的运算相比使用较低位数执行的运算中的学习失败的征兆；回滚至检测到所述征兆的运算，并且通过使用所述特定位数的运算来执行重新计算；确定是否允许从使用所述特定位数的运算返回至使用所述较低位数的运算；以及当允许返回至使用所述较低位数的运算时，切换至使用所述较低位数的运算。2.根据权利要求1所述的计算机可读记录介质，其中，切换至使用所述较低位数的运算包括：切换至深度学习整数DL
‑
INT运算或量化整数QINT运算。3.根据权利要求1或2所述的计算机可读记录介质，其中，检测所述征兆包括：当输入张量的Q值之间的差在允许范围以外时，检测所述征兆。4.根据权利要求1或2所述的计算机可读记录介质，其中，检测所述征兆包括：当输出张量之间的Q值变化范围大于或等于特定阈值时，检测所述征兆。5.根据权利要求1或2所述的计算机可读记录介质，其中，检测所述征兆包括：确定用于计算Q值的采样值是否全部为零，以及当所述采样值全部为零时，基于过去的Q值检测所述征兆。6.根据权利要求1或2所述的计算机可读记录介质，其中，检测所述征兆包括：当经历上溢或下溢的元素数量相对于要采样的元素数量大于或等于特定...

【专利技术属性】
技术研发人员：郭家俊，加藤雅也，赤尾和俊，福士达也，胜木隆史，泽田孝，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人