【技术实现步骤摘要】
加速非线性数学计算的系统及方法相关应用本申请要求于2019年1月16日递交的,美国临时专利申请号为62/792,985的优先权,其整体内容在此藉由参考纳入其中。
本专利技术的实施例涉及用于人工智能(artificialintelligence,AI)计算的处理器以及加速器(accelerator)。
技术介绍
深度学习(deeplearning)由于其在计算机视觉(computervision)、语义识别(speechrecognition)、自然语言处理(naturallanguage)、生物信息学(bioinformatics)等等领域中的优越性能而得到广泛认可。深度学习是机器学习(machinelearning)的分支,其使用包括超过一个隐藏层(hiddenlayer)的人工神经网络(artificialneuralnetwork)。神经网络计算的负载是密集的以及通常涉及非线性函数的评估(evaluation),也即计算所述非线性函数。例如,在特征提取中、神经网络计算可以包括用一组滤波器的输入数 ...
【技术保护点】
1.一种用于加速非线性数学计算的系统,包括:/n加速器,包括一组第一评估器以及一组第二评估器,其中每一所述第一评估器以及所述第二评估器是为评估各自的非线性函数指定的固定功能硬件电路;以及/n处理器,耦合于所述加速器,所述处理器用于解码指令集中的数学指令,发送识别非线性函数的信号到所述加速器,所述非线性函数对应于所述数学指令,以及从所述加速器接收所述非线性函数的输出,/n其中所述加速器根据所述信号用于使用一个第一评估器来评估所述非线性函数,以及,当所述信号识别所述非线性函数为复合函数时,对所述一个第一评估器的输出额外地使用一个第二评估器。/n
【技术特征摘要】
20190116 US 62/792,985;20191231 US 16/731,5271.一种用于加速非线性数学计算的系统,包括:
加速器,包括一组第一评估器以及一组第二评估器,其中每一所述第一评估器以及所述第二评估器是为评估各自的非线性函数指定的固定功能硬件电路;以及
处理器,耦合于所述加速器,所述处理器用于解码指令集中的数学指令,发送识别非线性函数的信号到所述加速器,所述非线性函数对应于所述数学指令,以及从所述加速器接收所述非线性函数的输出,
其中所述加速器根据所述信号用于使用一个第一评估器来评估所述非线性函数,以及,当所述信号识别所述非线性函数为复合函数时,对所述一个第一评估器的输出额外地使用一个第二评估器。
2.如权利要求1所述的用于加速非线性数学计算的系统,其中所述指令集包括至少一个复合指令,所述复合指令指定所述数学指令以及由所述处理器执行的一个或多个指令,以及其中所述处理器用于并行解码所述复合指令中的所述数学指令以及所述一个或多个指令。
3.如权利要求1所述的用于加速非线性数学计算的系统,其中所述加速器包括多个管线阶段来在完成第一非线性函数的评估之前,评估一第二非线性函数。
4.如权利要求3所述的用于加速非线性数学计算的系统,其中所述处理器包括多个管线阶段来在连续的时钟周期中赋能所述加速器来评估所述第一非线性函数以及所述第二非线性函数。
5.如权利要求1所述的用于加速非线性数学计算的系统,其中所述加速器包括进一步第一评估单元以及第二评估单元,所述第一评估单元进一步包括所述一组第一评估器以及所述第二评估单元进一步包括所述一组第二评估器,以及
其中所述第一评估单元具有耦合于所述第二评估单元第一输出路径,以及旁路所述第二评估单元的第二输出路径。
6.如权利要求1所述的用于加速非线性数学计算的系统,其中所述处理器进一步包括累加器,来在多次迭代中累加来自所述加速器的非线性函数输出。
7.如权利要求6所述的用于加速非线性数学计算的系统,其中所述处理器用于执行指令来使用所述累加的非线性函数输出来计算softmax函数。
8.如权利要求1所述的用于加速非线性数学计算的系统,其中所述指令集包括指定复合函数的数学指令,以及其中每一复合函数是至少两个非线性函数的复合。
9.如权利要求8所述的用于加速非线性数学计算的系统,其中所述复合函数包括至少一个sigmoid函数或双曲线正切函数。
10.如权利要求1所述的用于加速非线性数学计算的系统,其中所述第一评估器用于评估非线性函数,所述非线性函数包括至少指数函数、对数函数、倒数函数以及三角函数。
11.如权利要求1所...
【专利技术属性】
技术研发人员:陈彦妤,陈威仁,陈昱嘉,
申请(专利权)人:联发科技股份有限公司,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。