【技术实现步骤摘要】
深度学习模型的推理方法、装置、电子设备和存储介质
[0001]本公开涉及人工智能
,尤其涉及深度学习
,可应用于音频合成场景下。更具体地,本公开提供了一种深度学习模型的推理方法、装置、电子设备、存储介质和程序产品。
技术介绍
[0002]深度学习模型的模型推理可以指简化并使用深度学习模型,使模型能够快速、高效地对未知的数据进行操作,以获得预期的结果。深度学习模型的模型推理策略是深度学习模型运算性能的重要影响因素。
技术实现思路
[0003]本公开提供了一种深度学习模型的推理方法、装置、电子设备、存储介质和程序产品。
[0004]根据本公开的一方面,提供了一种深度学习模型的推理方法,包括:响应于接收到模型推理请求,基于上述模型推理请求包括的目标模型的模型标识,从托管存储单元获取与上述目标模型关联的模型运算图和线程块配置文件,其中,上述模型推理请求还包括待处理数据,上述模型运算图包括多个节点,上述多个节点各自表示上述目标模型的多个功能模块,上述多个节点之间的边表示多个上述功能模块的运行顺序,上述线程块配置文件表示计算单元中的多个线程块与上述功能模块的对应关系;以及基于上述模型运算图和上述线程块配置文件,依次运行上述多个线程块来处理上述待处理数据,得到上述目标模型的模型推理结果。
[0005]根据本公开的另一方面,提供了一种深度学习模型的推理装置,包括:获取模块,用于响应于接收到模型推理请求,基于上述模型推理请求包括的目标模型的模型标识,从托管存储单元获取与上述目标模型关联的模型 ...
【技术保护点】
【技术特征摘要】
1.一种深度学习模型的推理方法,包括:响应于接收到模型推理请求,基于所述模型推理请求包括的目标模型的模型标识,从托管存储单元获取与所述目标模型关联的模型运算图和线程块配置文件,其中,所述模型推理请求还包括待处理数据,所述模型运算图包括多个节点,所述多个节点各自表示所述目标模型的多个功能模块,所述多个节点之间的边表示多个所述功能模块的运行顺序,所述线程块配置文件表示计算单元中的多个线程块与所述功能模块的对应关系;以及基于所述模型运算图和所述线程块配置文件,依次运行所述多个线程块来处理所述待处理数据,得到所述目标模型的模型推理结果。2.根据权利要求1所述的方法,其中,所述依次运行所述多个线程块来处理所述待处理数据包括多次迭代过程;其中,所述模型运算图配置有同步点序列,所述同步点序列包括多个同步点参数,所述多个同步点参数各自与所述多次迭代过程相对应,所述同步点参数的值表示与所述同步点参数对应的迭代过程中参与运算的线程块的最大数量。3.根据权利要求2所述的方法,其中,所述多次迭代过程中的每次迭代过程包括:从所述待处理数据中确定目标输入数据;以及基于所述模型运算图、所述线程块配置文件和与目标迭代过程对应的目标同步点参数,依次运行所述多个线程块来处理所述目标输入数据,得到所述目标迭代过程的输出数据;其中,所述依次运行所述多个线程块来处理所述待处理数据,得到所述目标模型的模型推理结果,包括:基于所述多次迭代过程各自的输出数据,得到所述目标模型的模型推理结果。4.根据权利要求3所述的方法,其中,所述基于所述模型运算图、所述线程块配置文件和与目标迭代过程对应的目标同步点参数,依次运行所述多个线程块来处理所述目标输入数据,得到所述目标迭代过程的输出数据,包括:确定目标同步点标识数据,其中,所述目标同步点标识数据表示所述目标迭代过程中已参与运算的线程块的数量;在所述目标同步点标识数据小于或等于所述目标同步点参数的情况下,基于所述目标同步点标识数据确定第一目标线程块;根据所述线程块配置文件,确定与所述第一目标线程块对应的第一功能模块;根据所述模型运算图,确定与所述第一功能模块关联的第二功能模块;根据所述第二功能模块的输出数据,确定当前输入数据;以及运行所述第一目标线程块来处理所述当前输入数据,得到当前输出数据。5.根据权利要求4所述的方法,其中,所述模型推理请求还包括所述目标模型的参数;所述方法还包括:基于所述线程块配置文件,将所述目标模型的参数分别写入多个所述线程块各自的共享存储单元。6.根据权利要求5所述的方法,其中,所述运行所述第一目标线程块来处理所述当前输入数据,得到当前输出数据,包括:从所述目标线程块的共享存储单元中读取目标模型参数;以及
运行所述第一目标线程块,对所述目标模型参数和所述当前输入数据进行矩阵运算,得到所述当前输出数据。7.根据权利要求5所述的方法,其中,所述基于所述线程块配置文件,将所述目标模型的参数分别写入多个所述线程块各自的共享存储单元,包括:对于每个所述功能模块,从所述目标模型的参数中确定与所述功能模块对应的目标参数集;基于所述线程块配置文件,确定与所述功能模块对应的第二目标线程块;以及将所述目标参数集写入所述第二目标线程块的共享存储单元。8.根据权利要求4所述的方法,还包括:在运行所述第一目标线程块来处理所述当前输入数据,得到当前输出数据之后,利用预设规则调整所述目标同步点标识数据。9.根据权利要求4所述的方法,还包括:在所述目标同步点标识数据大于所述目标同步点参数的情况下,控制所述多个线程块停止运行;以及基于所述多个线程块的当前输出数据,得到所述目标迭代过程的输出数据。10.根据权利要求1所述的方法,还包括:基于所述目标模型的参数,确定所述多个功能模块各自的资源占用信息;基于所述计算单元的资源配置信息和多个功能模块各自的资源占用信息,生成所述线程块配置文件;以及将所述线程块配置文件写入所述托管存储单元。11.一种深度学习模型的推理装置,包括:获取模块,用于响应于接收到模型推理请求,基于所述模型推理请求包括的目标模型的模型标识,从托管存储单元获取与所述目标模型关联的模型运算图和线程块配置文件,其中,所述模型推理请求还包括待处理数据,所述模型运算图包括多个节点,所述多个节点各自表示所述目标模型的多个功能模块,所述多个节点之间的边表示多个所述功能模块的运行顺序,所述线程块配置...
【专利技术属性】
技术研发人员:丛士钧,王桂彬,徐扬凯,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。