模型训练方法、装置、电子设备及介质制造方法及图纸

技术编号:37990127 阅读:9 留言:0更新日期:2023-06-30 10:04
本申请公开了一种模型训练方法、装置、电子设备及介质,属于人工智能领域。该模型训练方法,包括:将第一音频输入至第一神经网络模型,得到所述第一神经网络模型输出的第二音频;将所述第二音频输入至第二神经网络模型,得到所述第二神经网络模型输出的第三音频;基于所述第一音频对应的标签和所述第二音频确定第一损失函数,基于所述第一音频对应的标签和所述第三音频确定第二损失函数;基于所述第一损失函数和所述第二损失函数,更新所述第一神经网络模型。神经网络模型。神经网络模型。

【技术实现步骤摘要】
模型训练方法、装置、电子设备及介质


[0001]本申请属于人工智能领域,具体涉及一种模型训练方法、装置、电子设备及介质。

技术介绍

[0002]人工智能(Artificial Intelligence,AI)神经网络技术广泛应用于音频降噪、音频切分、语音识别及语音合成等音频处理领域,相比传统的音频信号处理方法,AI神经网络技术针对不同类型音频及不同处理任务都有着非常好的处理效果。
[0003]但AI神经网络技术中所采用的神经网络模型通常占用的资源存储空间和计算复杂度很高,相应功耗也会增加,在一般的边缘、移动手持设备中上更加青睐复杂度不高、占用存储空间低的小模型,但对于小模型而言,其音频处理性能通常较低。
[0004]相关技术中,主要有两种提升模型性能的研究方向,一是从模型拓扑结构上进行改进优化,通过引入卷积、编码器、解码器等结构提升模型性能,但这种方式额外了增加模型的复杂度和存储资源,使得模型的实际部署更加困难;二是对损失函数优化以提升模型性能,损失函数优化过程复杂,需要花费大量人工对相关参数进行调优,效率低且模型性能的提升效果有限。

技术实现思路

[0005]本申请实施例的目的是提供一种模型训练方法、装置、电子设备及介质,能够解决如何在不增加模型复杂度和存储资源的同时,提升模型性能的问题。
[0006]第一方面,本申请实施例提供了一种模型训练方法,该方法包括:
[0007]将第一音频输入至第一神经网络模型,得到所述第一神经网络模型输出的第二音频;
[0008]将所述第二音频输入至第二神经网络模型,得到所述第二神经网络模型输出的第三音频;
[0009]基于所述第一音频对应的标签和所述第二音频确定第一损失函数,基于所述第一音频对应的标签和所述第三音频确定第二损失函数;
[0010]基于所述第一损失函数和所述第二损失函数,更新所述第一神经网络模型。
[0011]第二方面,本申请实施例提供了一种模型训练装置,该装置包括:
[0012]第一处理模块,用于将第一音频输入至第一神经网络模型,得到所述第一神经网络模型输出的第二音频;
[0013]第二处理模块,用于将所述第二音频输入至第二神经网络模型,得到所述第二神经网络模型输出的第三音频;
[0014]第三处理模块,用于基于所述第一音频对应的标签和所述第二音频确定第一损失函数,基于所述第一音频对应的标签和所述第三音频确定第二损失函数;
[0015]第四处理模块,用于基于所述第一损失函数和所述第二损失函数,更新所述第一神经网络模型。
[0016]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
[0017]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0018]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
[0019]第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
[0020]在本申请实施例中,通过第二神经网络模型学习第一神经网络模型的预测结果与标签之间的预测误差,通过第二损失函数反向传播将该预测误差反馈给第一神经网络模型,显著提高第一神经网络模型的性能,且第二神经网络模型只在训练过程中应用,避免增加模型复杂度,节省第一神经网络模型的存储资源开销,便于第一神经网络模型的部署。
附图说明
[0021]图1是本申请实施例提供的模型训练方法的流程示意图之一;
[0022]图2是本申请实施例提供的训练第一神经网络模型的误差反向传播路径示意图之一;
[0023]图3是本申请实施例提供的模型训练方法的流程示意图之二;
[0024]图4是本申请实施例提供的第一神经网络模型的训练框架示意图;
[0025]图5是本申请实施例提供的音频降噪模型的训练框架示意图;
[0026]图6是本申请实施例提供的模型训练装置的结构示意图;
[0027]图7是本申请实施例提供的电子设备的结构示意图;
[0028]图8是本申请实施例提供的电子设备的硬件示意图。
具体实施方式
[0029]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0030]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0031]相关技术中,进行提升模型性能有两种方式:
[0032]其一,从模型拓扑结构上进行改进优化,通过引入卷积、编码器、解码器等结构提升模型性能,但这种方式额外了增加模型的复杂度和存储资源,使得模型的实际部署更加
困难;
[0033]其二,对损失函数优化以提升模型性能,通常为多损失函数加权对模型性能进行优化,但这种方法中各个损失函数的权重的分配需要花费大量人工调优且难以找到最优值,又由于不同损失函数量纲的差异以及训练时损失函数以及其权重相对固定的限制,对模型性能的提升效果有限。
[0034]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的模型训练方法、装置、电子设备及介质进行详细地说明。
[0035]其中,模型训练方法可应用于终端,具体可由,终端中的硬件或软件执行。
[0036]该终端包括但不限于具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话或平板电脑等其它便携式通信设备。还应当理解的是,在某些实施例中,该终端可以不是便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
[0037]以下各个实施例中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和控制杆的一个或多个其它物理用户接口设备。
[0038]本申请实施例提供的模型训练方法,该模型训练方法的执行主体可以为电子设备或者电子设备中能够实现该模型训练方法的功能模块或功能实体,本申请实施例提及的电子设备包括但不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:将第一音频输入至第一神经网络模型,得到所述第一神经网络模型输出的第二音频;将所述第二音频输入至第二神经网络模型,得到所述第二神经网络模型输出的第三音频;基于所述第一音频对应的标签和所述第二音频确定第一损失函数,基于所述第一音频对应的标签和所述第三音频确定第二损失函数;基于所述第一损失函数和所述第二损失函数,更新所述第一神经网络模型。2.根据权利要求1所述的模型训练方法,其特征在于,基于所述第二损失函数,更新所述第一神经网络模型,包括:基于所述第二损失函数,通过反向传播算法沿第一传播路径更新所述第二神经网络模型和所述第一神经网络模型,所述第一传播路径为所述第二损失函数经过所述第二神经网络模型至所述第一神经网络模型的路径。3.根据权利要求1所述的模型训练方法,其特征在于,所述将第一音频输入至第一神经网络模型,得到所述第一神经网络模型输出的第二音频,包括:将第一音频输入至第一神经网络模型,在第一域处理所述第一音频,得到所述第二音频;所述将所述第二音频输入至第二神经网络模型,得到所述第二神经网络模型输出的第三音频,包括:将所述第二音频输入至第二神经网络模型,在第二域处理所述第二音频,得到所述第三音频,所述第一域与所述第二域不同。4.根据权利要求1所述的模型训练方法,其特征在于,所述将第一音频输入至第一神经网络模型,得到所述第一神经网络模型输出的第二音频,包括:将所述第一音频输入至所述第一神经网络模型的第一网络结构,得到所述第二音频;所述将所述第二音频输入至第二神经网络模型,得到所述第二神经网络模型输出的第三音频,包括:将所述第二音频输入至所述第二神经网络模型的第二网络结构,得到所述第三音频,所述第二神经网络的目标参数大于所述第一神经网络的目标参数;其中,所述目标参数包括以下至少一项:网络结构复杂度、网络尺寸。5.根据权利要求1

4任一项所述的模型训练方法,其特征在于,所述更新所述第一神经网络模型之前,所述方法还包括:基于所述第二音频和所述第三音频,确定第三损失函数;所述更新所述第一神经网络模型,包括:基于所述第一损失函数、所述第二损失函数和所述第三损失函数,更新所述第一神经网络模型。6.根据权利要求5所述的模型训练方法,其特征在于,所述基于所述第一损失函数、所述第二损失函数和所述第三损失函...

【专利技术属性】
技术研发人员:许超刘良兵王少华
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1