【技术实现步骤摘要】
运算方法、装置、计算机设备和存储介质
[0001]本公开涉及计算机
,特别是涉及一种运算方法、装置、计算机设备和存储介质。
技术介绍
[0002]在人工智能
,神经网络算法是非常流行的一种机器学习算法,在各种领域中都取得了非常好的效果,比如图像识别,语音识别,自然语言处理等。随着神经网络算法的发展,算法的复杂度也越来越高,为了提高识别度,模型的规模也在逐渐增大。
技术实现思路
[0003]基于此,有必要针对上述技术问题,提供一种能够实现包含控制流的神经网络的并行运行的运算方法、装置、计算机设备和存储介质。
[0004]根据本公开的一方面,提供了一种控制流多核并行方法,所述方法包括:
[0005]遍历神经网络中的算子,确定神经网络中的待处理的控制流算子;
[0006]将所述待处理的控制流算子复制到处理器的多个核中;
[0007]在神经网络中插入与所述待处理的控制流算子的类型对应的数据处理算子,以对所述待处理的控制流算子的操作数进行处理,
[0008]其中,所述 ...
【技术保护点】
【技术特征摘要】
1.一种控制流多核并行方法,其特征在于,所述方法包括:遍历神经网络中的算子,确定神经网络中的待处理的控制流算子;将所述待处理的控制流算子复制到处理器的多个核中;在神经网络中插入与所述待处理的控制流算子的类型对应的数据处理算子,以对所述待处理的控制流算子的操作数进行处理,其中,所述数据处理算子为拆分算子或者合并算子,用于对所述待处理的控制流算子的操作数进行拆分或者合并。2.根据权利要求1所述的方法,其特征在于,所述待处理的控制流算子为merge算子或者nextIter算子,在神经网络中插入与所述待处理的控制流算子的类型对应的数据处理算子,以对所述待处理的控制流算子的操作数进行处理,包括:在所述待处理的控制流算子之前插入拆分算子,所述拆分算子用于对所述待处理的控制流算子的输入操作数进行拆分得到子输入操作数。3.根据权利要求2所述的方法,其特征在于,所述拆分算子用于按照核的顺序对所述待处理的控制流算子的输入操作数进行拆分,得到复制到核上的待处理的控制流算子对应的子输入操作数。4.根据权利要求1-3任意一项所述的方法,其特征在于,所述待处理的控制流算子为switch算子,在神经网络中插入与所述待处理的控制流算子的类型对应的数据处理算子,以对所述待处理的控制流算子的操作数进行处理,包括:在所述待处理的控制流算子之后插入合并算子,所述合并算子用于对复制到多个核上的待处理的控制流算子的输出操作数进行合并。5.根据权利要求4所述的方法,其特征在于,所述合并算子用于按照核的顺序对复制到多个核上的待处理的控制流算子的输出操作数进行合并。6.一种控制流多核并行装置,其特征在于,所述装置包括:遍历模块,用于遍历神经网络中的算子,确定神经网络中的待处理的...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:安徽寒武纪信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。