硬件构造差异编程的计算机化方法技术

技术编号：37210680 阅读：14 留言：0更新日期：2023-04-20 23:01

本申请的各方面以及实施例通过将可微分编程(DP)并入硬件(例如用于AI的硬件)来克服现有方法的缺陷。在一个方面中，AI软件程序可以是计算图，其可以包括参数化的计算节点，每个计算节点将输入作为上游节点的输出，并且计算输出以馈送给下游节点。在另一方面中，可以通过“训练”过程来确定所有计算节点的参数。在一个方面中，训练程序首先计算用到最终输出的端到端损失，然后计算该损失的输出梯度。在另一方面中，该过程还可以使用标准计算链规则重复地计算中间梯度，遵循用于计算输出的相反方向。向。向。

全部详细技术资料下载

【技术实现步骤摘要】
硬件构造差异编程的计算机化方法
[0001]相关申请的交叉引用
[0002]本申请要求于2021年11月25日提交的序列号为63/283,249的临时申请的优先权，该临时申请的公开内容在此全文引入作为参考。

技术介绍

[0003]随着全球芯片出现短缺，据报道，一些主要的制造商已经提高了芯片价格，并推迟了其3纳米(nm)制程的生产进程。然而，无论这些报告是否可靠，这都提醒我们，摩尔定律的衰退将带来越来越严重的影响，并迫使我们重新思考人工智能(AI)硬件——它会受到这种衰退的影响，还是会帮助扭转这种趋势？
[0004]如果我们希望恢复摩尔定律的良性循环，这其中，软件和硬件曾经相互加持，使一部现代智能手机比过去10年占据整个仓库的超级计算机功能更强大。人们普遍接受后摩尔时代的良性循环是基于更大的数据迸发更大的模型并需要更强大的机器。但事实上，这样的循环是不可持续的。
[0005]除非我们重新定义并行性，否则，不能再指望缩小晶体管来制造越来越宽的并行处理器。同样，也不能依赖于特定领域架构(DSA)，除非它有助于促进及适应软件的发展。
[0006]目前，大多数AI硬件架构围绕加速矩阵乘法中工作量繁重的现有成熟的机器学习(ML)，以及依靠图形处理单元(GPU)来进行繁重的工作。在一实例中，一些GPU组成的超级计算机试图使用专门设计的半导体芯片(例如，D1芯片)来出色的实现联网、集成和可缩放性。然而，D1芯片作为这种超级计算机的组成部件，在架构上几乎没有突破。
[0007]可以将当前GPU竞争者分为两个阵营：...

【技术保护点】

【技术特征摘要】
1.一种用于为硬件构造差异编程的计算机化方法，其特征在于，包括：识别与所述硬件相关联的一个或多个计算节点，其中，所述一个或多个计算节点中的每一个包括输入和至少一个参数；基于所识别的一个或多个计算节点，以及所述输入和所述至少一个参数，为所述一个或多个计算节点中的每一个构造计算图；为所述一个或多个计算节点中的每一个计算输出；计算所述一个或多个计算节点中的每一个的所述输入和所述输出之间的差分；基于所述差分确定输入梯度；以及将所述输入梯度作为反馈传播到所述计算图中的至少一个上游节点。2.根据权利要求1所述的计算机化方法，其特征在于，还包括：为所述一个或多个计算节点中的每一个计算输出差分。3.根据权利要求1所述的计算机化方法，其特征在于，还包括：为所述一个或多个计算节点中的每一个的至少一个参数计算参数差分值。4.根据权利要求3所述的计算机化方法，其特征在于，还包括：将所述至少一个参数调整为所述参数差分的函数。5.根据权利要求1所述的计算机化方法，其特征在于，其中，所述硬件包括半导体芯片。6.根据权利要求5所述的计算机化方法，其特征在于，其中，所述硬件包括图形处理器。7.根据权利要求1所述的计算机化方法，其特征在于，其中，所述硬件包括特定领域架构硬件。8.一种用于在神经网络设置中...

【专利技术属性】
技术研发人员：吕坚平，
申请(专利权)人：上海天数智芯半导体有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人