深度学习模型的训练方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:37249637 阅读:23 留言:0更新日期:2023-04-20 23:28
本公开公开了深度学习模型的训练方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习、图像处理、文本处理、计算机视觉技术领域。具体实现方案为:根据样本数据的特征数据,生成目标处理策略,其中,目标处理策略表征在执行深度学习模型的训练过程中样本数据与处理路径之间的分配策略,处理路径包括第一目标处理路径和预定处理路径;基于目标处理策略,利用深度学习模型对样本数据进行处理,得到第一目标处理路径被调用的概率信息和预定处理路径的执行时长信息;根据概率信息和执行时长信息,调整目标处理策略,得到目标调整策略;以及基于目标调整策略,对深度学习模型进行训练,得到经训练的深度学习模型。型。型。

【技术实现步骤摘要】
深度学习模型的训练方法、装置、电子设备以及存储介质


[0001]本公开涉及人工智能
,尤其涉及深度学习、图像处理、文本处理、计算机视觉
具体涉及一种深度学习模型的训练方法、装置、电子设备以及存储介质。

技术介绍

[0002]深度学习作为机器学习的分支,是一种以神经网络为架构,对数据进行表征学习的算法。目前已衍生多种深度学习模型,例如:深度神经网络、卷积神经网络、深度置信网络和递归神经网络等。
[0003]随着人工智能技术的发展,深度学习模型被广泛应用于各种领域,例如:计算机视觉、语音识别、自然语音处理、音频识别与生物信息学等。

技术实现思路

[0004]本公开提供了一种深度学习模型的训练方法、装置、电子设备以及存储介质。
[0005]根据本公开的一方面,提供了一种深度学习模型的训练方法,包括:根据样本数据的特征数据,生成目标处理策略,其中,上述目标处理策略表征在执行深度学习模型的训练过程中样本数据与处理路径之间的分配策略,上述处理路径包括第一目标处理路径和预定处理路径;基于上述目标处理策略,利用深度本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的训练方法,包括:根据样本数据的特征数据,生成目标处理策略,其中,所述目标处理策略表征在执行深度学习模型的训练过程中所述样本数据与处理路径之间的分配策略,所述处理路径包括第一目标处理路径和预定处理路径;基于所述目标处理策略,利用所述深度学习模型对所述样本数据进行处理,得到所述第一目标处理路径被调用的概率信息和所述预定处理路径的执行时长信息;以及根据所述概率信息和所述执行时长信息,调整所述目标处理策略,得到目标调整策略;基于所述目标调整策略,对所述深度学习模型进行训练,得到经训练的深度学习模型。2.根据权利要求1所述的方法,其中,所述样本数据包括I组样本数据,I为大于1的整数,所述根据所述概率信息和所述执行时长信息,调整所述目标处理策略,得到目标调整策略,包括:针对I组样本数据中的第i组样本数据,在确定所述概率信息小于预设阈值的情况下,根据所述执行时长信息,基于选择策略从所述预定处理路径中得到第二目标处理路径的信息,其中,i为大于1且小于等于I的整数;根据所述第二目标处理路径的信息更新样本数据的特征信息与处理路径的映射关系,返回执行目标处理策略的生成操作,得到中间调整策略;基于所述中间调整策略,返回执行样本数据的处理操作,并递增i;以及在确定所述概率信息满足预设阈值的情况下,得到所述目标调整策略。3.根据权利要求2所述的方法,其中,所述第i组样本数据包括M个样本数据,M为大于1的整数,所述目标处理策略的生成操作,包括:针对所述第i组样本数据中的m个样本数据的特征信息,从样本数据的特征信息与处理路径的映射关系中查询得到第一目标处理路径的信息;以及将所述m个样本数据与所述第一目标处理路径进行关联处理,将所述M

m个样本数据与所述预定处理路径进行关联处理,得到所述目标处理策略,其中,m为大于等于1且小于等于M的整数。4.根据权利要求2所述的方法,其中,所述预定处理路径中包括S个预定处理子路径,在所述目标处理策略中与所述预定处理路径对应的样本数据为N个,所述根据所述执行时长信息,基于选择策略从所述预定处理路径中得到第二目标处理路径的信息,包括:针对第n个样本数据,依次按照所述S个预定处理子路径执行处理操作,得到S个执行时长信息,其中,n为大于等于1且小于等于N的整数,S为大于1的整数,N为大于1且小于等于M的整数;基于所述选择策略,根据所述S个执行时长信息,从所述S个预定处理子路径中得到第n个目标处理子路径的信息;以及在确定n小于N的情况下,返回执行所述处理操作,并递增n;在确定n等于N的情况下,得到所述第二目标处理路径的信息。5.根据权利要求4所述的方法,其中,所述基于所述选择策略,根据所述S个执行时长信息,从所述S个预定处理子路径中得到第n个目标处理子路径的信息,包括:根据所述S个执行时长信息,将所述S个预定处理子路径进行排序,得到排序结果;以及基于所述选择策略,根据所述排序结果,从所述S个预定处理子路径中得到第n个目标
处理子路径的信息。6.根据权利要求4所述的方法,其中,在确定n等于N的情况下,得到所述第二目标处理路径的信息,包括:在确定n等于N的情况下,将N个样本数据的特征信息与N个目标处理子路径进行关联存储,得到所述第二目标处理路径的信息。7.根据权利要求1所述的方法,其中,所述基于目标处理策略,对所述样本数据进行处理,得到所述第一目标处理路径被调用的概率信息和所述预定处理路径的执行时长信息,包括:基于目标处理策略,对所述样本数据进行处理,得到所述第一目标处理路径被调用的次数信息、所述预定处理路径被调用的次数信息和所述预定处理路径的执行时长信息;以及根据所述第一目标处理路径被调用的次数信息和所述预定处理路径被调用的次数信息,得到所述概率信息。8.根据权利要求1所述的方法,还包括:获取所述深度学习模型预定处理路径信息;以及基于回调机制,将所述预定处理路径信息以回调函数的形式进行存储。9.根据权利要求1所述的方法,还包括:将所述概率信息向客户端发送,并接收反馈信息;根据所述反馈信息调整所述预设阈值;以及基于调整后的预设阈值,重新执行所述深度学习模型的训练操作。10.根据权利要求1所述的方法,其中,所述样本数据包括以下至少之一:图像数据、文本数据;所述样本数据的特征数据包括以下至少之一:图像尺寸特征数据、像素空间排布特征数据、像素尺寸特征数据。11.一种深度学习模型的训练装置,包括:生成模块,用于根据样本数据的特征数据,生成目标处理策略,其中,所述目标处理策略表征在执行深度学习模型的训练过程中所述样本数据与处理路径之间的分配策略,所述处理路径包括第一目标处理路径和预定...

【专利技术属性】
技术研发人员:李铭书张婷刘益群蓝翔于佃海马艳军
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1