【技术实现步骤摘要】
本专利技术实施例涉及数据处理,尤其涉及一种面向人工智能芯片的实现方法及电路。
技术介绍
1、现有技术中,传统的人工神经网络处理器中,面临着算力不足、功耗过大、时延较长等问题,严重影响人工智能芯片在更多场景中的普及和使用,同时人工神经网络处理器往往训练和推理相分离。因此,如何进一步提升人工智能芯片计算能力,成为智能计算芯片架构设计面临的重要挑战。现有技术中已经存在多种自适应调频技术,例如动态电压频率调节技术(dvfs)、动态功耗管理技术(dpm)等。这些技术可以通过动态调整处理器的时钟频率和电压,实现计算资源的优化分配。因此,本芯片方案中的自适应调频技术可以借鉴现有技术的经验和成果,以实现更高效的计算资源管理。
2、现有技术中的自适应调频技术虽然可以动态调整处理器的时钟频率和电压,但其调整的粒度和范围仍然受限,难以实现更加精细的计算资源管理和优化。具体地说,自适应调频技术通常是通过改变处理器全局的时钟频率和电压来实现功耗和性能之间的平衡,从而优化计算资源的使用效率。然而,在现有技术中,处理器时钟频率和电压的调整通常是基于一些简
...【技术保护点】
1.一种面向人工智能芯片的实现方法及电路,其特征在于,包括:
2.如权利要求1所述的电路,其特征在于,所述计算单元可以根据任务和配置需要升高频率或者降低频率。在该计算单元陈列中,部分承载高算力需求任务的计算单元可以执行在高频范围,部分承载低算力需求任务的计算单元可以执行在低频范围。所述计算任务类型包括训练任务、推理任务和训练推理同步进行任务。根据不同的任务和配置需要,计算单元可以实现时钟工作频率以实现自身工作频率的调整,以及在当前计算设备内实现不同计算单元分别的升高频率或者降低频率且可以进行灵活的自分配。
3.如权利要求1所述的电路,其特征在于
...【技术特征摘要】
1.一种面向人工智能芯片的实现方法及电路,其特征在于,包括:
2.如权利要求1所述的电路,其特征在于,所述计算单元可以根据任务和配置需要升高频率或者降低频率。在该计算单元陈列中,部分承载高算力需求任务的计算单元可以执行在高频范围,部分承载低算力需求任务的计算单元可以执行在低频范围。所述计算任务类型包括训练任务、推理任务和训练推理同步进行任务。根据不同的任务和配置需要,计算单元可以实现时钟工作频率以实现自身工作频率的调整,以及在当前计算设备内实现不同计算单元分别的升高频率或者降低频率且可以进行灵活的自分配。
3.如权利要求1所述的电路,其特征在于,所述计算单元之间包含异步路由缓存,以实现跨频率数据的整合和对齐操作,以及计算任务的灵活频率分配和调整。在该异步路由缓存中,计算单元可以将数据存储到异步路由缓存中,然后通过缓存中转达到目标计算单元,完成跨频率数据的传输和整合。所述异步缓存,为非同步时钟电路,其不受跨频率或者跨时钟调度影响。计算单元获取当前需要执行的任务序列,然后通过控制器对计算单元的工作频率进行切换和配置。所述计算任务序列包括第一任务、第二任务、第三任务等。根据不同的任务和配置需要,计算单元可以实现不同的时钟工作频率以实现自身工作频率的调整,以实现在当前计算设备内升高频率或者降低频率且可以进行灵活的自分配。
4.如权利要求1所述的电路,其特征在于,所提出的计算单元内部传递信息通过路由表和数据包头部信息,确定数据的传输路径和目标计算单元。具体来讲,当计算单元需要发送数据时,它将数据包发送到异步路由缓存,并设置数据包的目标计算单元和缓存单元地址。进一步的,接收方计算单元通过读取异步路由缓存中的数据,进行数据处理。其中,通过上述方法,实现在当前计算设备内升高频率或者降低频率且可以进行灵活的自分配。
5.如权利要求1所述的电路,其特征在于,所提出的计算单元内部采用请求-...
【专利技术属性】
技术研发人员:巴宁,王春祥,王洲,王雅婷,岳文,
申请(专利权)人:北京冠邦开源技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。