【技术实现步骤摘要】
本专利技术实施例涉及数据处理,尤其涉及一种面向人工智能芯片的实现方法及电路。
技术介绍
1、现有技术中,已有的人工智能芯片方案主要分为两类,一类是专门针对人工神经网络的加速处理器,如nvidia的gpu、google的tpu等;另一类是通用处理器,如cpu、fpga等,通过软件实现人工智能计算。这些芯片方案在不同场景下有其优劣势,但是对于多任务自分配和调度的问题,需要在软硬件结合的设计上做更多的优化和创新。传统的人工神经网络处理器中,面临着算力不足、功耗过大、时延较长等问题,严重影响人工智能芯片在更多场景中的普及和使用,同时人工神经网络处理器往往训练和推理相分离。因此,如何进一步提升人工智能芯片计算能力,成为智能计算芯片架构设计面临的重要挑战。
2、可见,多任务计算和训练往往需要在不同的硬件资源上进行,如gpu、tpu等,且需要进行任务调度和数据传输,这样会增加系统的复杂度和延迟,同时也会增加功耗和成本。此外,传统方案的计算单元通常只能执行特定的任务,缺乏灵活性,无法满足复杂的应用场景需求。
技术
本文档来自技高网...【技术保护点】
1.一种面向人工智能芯片的实现方法及电路,其特征在于,包括:
2.如权利要求1所述的电路,其特征在于,所述超级计算单元可以根据任务和配置需要灵活切换自身任务类型。在该单元中,首先通过任务控制模块获取当前需要执行的任务类型,然后通过调度器对超级计算单元内的计算单元进行切换和配置。计算单元分为执行训练任务的计算单元、执行推理任务的计算单元和超级计算单元。所述计算任务类型包括训练任务、推理任务和训练推理同步进行任务。根据不同的任务和配置需要,超级计算单元可以实现不同计算单元之间的切换和任务类型配置,以实现实时的计算和推理可重构调整,以及计算任务类型的灵活调整。<
...【技术特征摘要】
1.一种面向人工智能芯片的实现方法及电路,其特征在于,包括:
2.如权利要求1所述的电路,其特征在于,所述超级计算单元可以根据任务和配置需要灵活切换自身任务类型。在该单元中,首先通过任务控制模块获取当前需要执行的任务类型,然后通过调度器对超级计算单元内的计算单元进行切换和配置。计算单元分为执行训练任务的计算单元、执行推理任务的计算单元和超级计算单元。所述计算任务类型包括训练任务、推理任务和训练推理同步进行任务。根据不同的任务和配置需要,超级计算单元可以实现不同计算单元之间的切换和任务类型配置,以实现实时的计算和推理可重构调整,以及计算任务类型的灵活调整。
3.如权利要求1所述的电路,其特征在于,所述超级计算单元可以根据任务和配置需要灵活切换自身所执行的任务序列。在该单元中,首先通过任务控制模块获取当前需要执行的任务序列,然后通过调度器对超级计算单元内的计算单元进行切换和配置。计算单元分为执行训练任务的计算单元、执行推理任务的计算单元和超级计算单元。所述计算任务序列包括第一任务、第二任务、第三任务等。根据不同的任务和配置需要,超级计算单元可以实现不同计算单元之间的切换和配置,以实现实时的不同计算任务序列可重构调整,以及计算任务序列的灵活调整。
4.如权利要求1所述的电路,其特征在于,所提出的超级计算单元内部包括精度数据转换,以实现实时的计算精度包括训练精度和推理精度的可重构调整,以实现计算任务负载的实时动态调整。所述精度包括64位浮点精度,32位浮点精度,16位半浮点精度,16位定点精度,8位定点精度,4位定点精度。浮点精度计算开销需求大于定点精度计算,位宽越大的计算开销越大;其中,本权利要求提出的超级计算单元,其特征在于根据任务和配置需要灵活切换自身任务类型和所执行的实时的计算精度包括训练精度和推理精度的可重构调整,即如在第一时间段内执行第一推理任务的8位定点精度,在第二时间段内执行第二训练任务的另一32位浮点精度,第一推理任务和第二推理任务属于不同的神经网络模型,以更好的支持强化学习等应用;其中,通过上述方法,实现在当前计算设备内不...
【专利技术属性】
技术研发人员:巴宁,王春祥,王洲,王雅婷,岳文,
申请(专利权)人:北京冠邦开源技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。