【技术实现步骤摘要】
应用于人工智能芯片的计算方法和人工智能芯片
本申请实施例涉及计算机
,具体涉及应用于人工智能芯片的计算方法和人工智能芯片。
技术介绍
人工智能芯片,即AI(ArtificialIntelligence)芯片,也被称为AI加速器或计算卡,是指专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。AI计算中运算的需求是巨大的,特别是复杂的运算需求对计算性能影响较大。复杂运算,虽然可以用基本运算指令来实现,但会降低复杂运算(如浮点开方运算、浮点求幂运算、三角函数运算等)执行效率。
技术实现思路
本申请实施例提出了应用于人工智能芯片的计算方法和人工智能芯片。第一方面,本申请实施例提供了一种应用于人工智能芯片的计算方法,至少一个处理器核中的目标处理器核对待执行指令进行译码,得到运算标识和至少一个操作数;目标处理器核响应于确定译码得到的运算标识为预设复杂运算标识,用译码得到的运算标识和至少一个操作数生成复杂运算指令;目标处理器核将所生成的复杂运算指令添加到复杂运算指令队列;运算 ...
【技术保护点】
1.一种应用于人工智能芯片的计算方法,其中,所述人工智能芯片包括至少一个处理器核和与所述至少一个处理器核中各个处理器核连接的运算加速部件,所述方法包括:/n所述至少一个处理器核中的目标处理器核对待执行指令进行译码,得到运算标识和至少一个操作数;/n所述目标处理器核响应于确定译码得到的运算标识为预设复杂运算标识,用译码得到的运算标识和至少一个操作数生成复杂运算指令;/n所述目标处理器核将所生成的复杂运算指令添加到复杂运算指令队列;/n所述运算加速部件从所述复杂运算指令队列中选取复杂运算指令;/n所述运算加速部件以所选取的复杂运算指令中的至少一个操作数为输入参数执行所选取的复杂 ...
【技术特征摘要】
1.一种应用于人工智能芯片的计算方法,其中,所述人工智能芯片包括至少一个处理器核和与所述至少一个处理器核中各个处理器核连接的运算加速部件,所述方法包括:
所述至少一个处理器核中的目标处理器核对待执行指令进行译码,得到运算标识和至少一个操作数;
所述目标处理器核响应于确定译码得到的运算标识为预设复杂运算标识,用译码得到的运算标识和至少一个操作数生成复杂运算指令;
所述目标处理器核将所生成的复杂运算指令添加到复杂运算指令队列;
所述运算加速部件从所述复杂运算指令队列中选取复杂运算指令;
所述运算加速部件以所选取的复杂运算指令中的至少一个操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算,得到运算结果;
所述运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列。
2.根据权利要求1所述的方法,其中,在所述至少一个处理器核中的目标处理器核对待执行指令进行译码之前,所述方法还包括:
响应于接收到待执行指令,在所述至少一个处理器核中选取执行所述待执行指令的处理器核作为目标处理器核。
3.根据权利要求2所述的方法,其中,所述复杂运算指令队列包括与所述至少一个处理器核中每个处理器核对应的复杂运算指令队列,所述复杂运算结果队列包括与所述至少一个处理器核中每个处理器核对应的复杂运算结果队列;以及
所述目标处理器核将所生成的复杂运算指令添加到复杂运算指令队列,包括:
所述目标处理器核将所生成的复杂运算指令添加到与所述目标处理器核对应的复杂运算指令队列;以及
所述运算加速部件从所述复杂运算指令队列中选取复杂运算指令,包括:
所述运算加速部件从与所述至少一个处理器核中各个处理器核对应的复杂运算指令队列中选取复杂运算指令;以及
所述运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列,包括:
所述运算加速部件将所得到的运算结果作为复杂运算结果写入所选取的复杂运算指令所来自的复杂运算指令队列对应的处理器核对应的复杂运算结果队列。
4.根据权利要求3所述的方法,其中,在所述运算加速部件将所得到的运算结果作为复杂运算结果写入所选取的复杂运算指令所来自的复杂运算指令队列对应的处理器核对应的复杂运算结果队列之后,所述方法还包括:
所述目标处理器核从与所述目标处理器核对应的复杂运算结果队列中选取复杂运算结果写入所述目标处理器核中的结果寄存器和/或所述人工智能芯片的存储器中。
5.根据权利要求2所述的方法,其中,所述目标处理器核响应于确定译码得到的运算标识为预设复杂运算标识,用译码得到的运算标识和至...
【专利技术属性】
技术研发人员:欧阳剑,杜学亮,徐英男,李慧敏,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。