【技术实现步骤摘要】
一种数据处理方法及相关产品本申请要求2019年4月18日提交,申请号为201910315962.9,专利技术名称为“一种数据处理方法及相关产品”的优先权。
本申请涉及人工智能处理器
,尤其涉及一种数据处理方法及相关产品。
技术介绍
现有技术中,当人工智能处理器成功流片后,算法应用开发者才能在对应版本的人工智能处理器(硬件实体)上进行开发和测试。从上述描述可以知道,现有技术中,只有在人工智能处理器流片之后,才能得知开发的人工智能算法在对应版本的人工智能处理器上运行的功能结果和性能结果。在实际应用场景下,人工智能处理器通常需要与其他处理器,比如CPU、GPU、DSP等抢占片外存储器的访存带宽;同时,如果人工智能处理器内部多个处理器核之间执行协同任务时相互之间也存在对于片外存储器带宽的抢占。在执行协同任务时,其中一个重要的参数为神经网络中的算子在某种拆分状态下在多核人工智能处理器上并行执行所用时间的估值取决于人工智能处理器的一个处理核可占用的片外存储器的访存带宽。这意味着,当实际带宽发生变化时,多核拆分的策略也将随之改变。那么,如何实现端侧人工智能处理器未流片时算法应用开发者即可展开不同的应用场景下人工智能算法模型与人工智能处理器之间的多核拆分方式的调试工作,是急需解决的问题。
技术实现思路
本申请实施例提供一种数据处理方法及相关产品,不管人工智能处理器是否流片,本技术方案都能够提前实现不同的应用场景下人工智能算法模型与人工智能处理器之间的多核拆分方式的调试工作。为实现上述目的,本 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述数据处理方法包括:/n读取离线运行文件集合;其中,所述离线运行文件集合是根据运行结果满足预设要求时对应的所述端侧人工智能处理器的硬件架构信息、访存带宽和二进制指令确定的离线运行文件构成的。/n对所述离线运行文件集合进行解析,获得离线运行文件映射表;其中,所述离线运行文件映射表是同一端侧人工智能处理器的硬件架构信息所对应的访存带宽与所述离线运行文件之间的对应关系。/n根据端侧人工智能处理器工作负荷情况,确定当前访存带宽;基于当前访存带宽从所述离线运行文件映射表中确定需执行的当前离线运行文件。/n执行当前离线运行文件。/n
【技术特征摘要】 【专利技术属性】
20190418 CN 20191031596291.一种数据处理方法,其特征在于,所述数据处理方法包括:
读取离线运行文件集合;其中,所述离线运行文件集合是根据运行结果满足预设要求时对应的所述端侧人工智能处理器的硬件架构信息、访存带宽和二进制指令确定的离线运行文件构成的。
对所述离线运行文件集合进行解析,获得离线运行文件映射表;其中,所述离线运行文件映射表是同一端侧人工智能处理器的硬件架构信息所对应的访存带宽与所述离线运行文件之间的对应关系。
根据端侧人工智能处理器工作负荷情况,确定当前访存带宽;基于当前访存带宽从所述离线运行文件映射表中确定需执行的当前离线运行文件。
执行当前离线运行文件。
2.如权利要求1所述的方法,其特征在于,所述离线运行文件映射表的获得步骤包括:
所述通用处理器获取端侧人工智能处理器的硬件架构信息以及对应的可配置的访存带宽,根据所述端侧人工智能处理器的硬件架构信息以及对应的访存带宽生成对应的二进制指令;其中,访存带宽为端侧人工智能处理器到片外存储器的访存宽度;
所述通用处理器根据所述二进制指令生成对应的人工智能学习任务,将所述人工智能学习任务发送至云侧人工智能处理器上运行;
所述云侧人工智能处理器接收人工智能学习任务,执行所述人工智能学习任务,生成运行结果;
所述通用处理器接收所述人工智能学习任务对应的运行结果,根据所述运行结果确定所述访存带宽对应的离线运行文件;其中,所述离线运行文件是根据运行结果满足预设要求时的所述端侧人工智能处理器的硬件架构信息以及对应的访存带宽和二进制指令生成的;
所述通用处理器根据同一端侧人工智能处理器的不同的访存带宽对应的离线运行文件确定离线运行文件映射表;其中,所述离线运行文件映射表是同一端侧人工智能处理器的硬件架构信息所对应的访存带宽与所述离线运行文件之间的对应关系。
3.如权利要求2所述的方法,其特征在于,根据所述端侧人工智能处理器的硬件架构信息以及对应的访存带宽生成对应的二进制指令的步骤包括:
所述通用处理器根据人工智能算法模型对应计算图中的目标算子,确定与所述目标算子相关联的张量数据的拆分状态集合;其中,所述张量数据包括输入张量数据和输出张量数据;
所述通用处理器遍历所述拆分状态集合,确定相邻拆分状态集合之间所述算子的张量数据的拆分路径以及所述拆分路径的权重;其中,所述拆分路径的权值基于所述访存带宽确定;
所述通用处理器根据所述拆分路径的权重,确定所述目标算子的张量数据的目标拆分路径,根据所述目标拆分路径对所述计算图中的目标算子进行拆分;
所述通用处理器根据所述端侧人工智能处理器的硬件架构信息对拆分后的神经网络模型进行编译,获得对应的二进制指令。
4.如权利要求2所述的方法,其特征在于,所述端侧人工智能处理器的硬件架构信息包括:片上存储大小、端侧人工智能处理器的核数、端侧人工智能处理器的运算器类型、端侧人工智能处理器的运行主频率。
5.如权利要求2所述的方法,其特征在于,所述通用处理器将端侧人工智能处理器的硬件架构信息写入驱动程序中,以根据所述驱动程序中的硬件架构信息适配云侧人工智能处理器。
6.如权利要求2所述的方法,其特征在于,根据所述运行结果确定所述离线运行文件,包括:
若所述运行结果满足预设要求,则根据满足所述预设要求的二进制指令生成对应的离线运行文件。
7.如权利要求2所述的方法,其特征在于,根据所述运行结果确定所述离线运行文件,还包括:
若所述运行结果不满足预设要求,执行如下过程中的至少一种优化方式,直至运行结果满足所述预设要求,并根据满足所述预设要求的二进制指令生成对应的离线运行文件;其中,所述优化方式包括:
调整所述端侧人工智能处理器的硬件架构信息;
或优化人工智能学习任务。
8.如权利要求7所述的方法,其特征在于,所述优化人工智能学习任务的步骤包括:
通过专用编程语言来优化人工智能学习任务。
9.如权利要求7或8所述的方法,其特征在于,所述优化人工智能学习任务的步骤还包括:
更新人工智能学习库的版本来优化人工智能学习任务。
技术研发人员:不公告发明人,
申请(专利权)人:中科寒武纪科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。