一种降噪方法及装置制造方法及图纸

技术编号:24253147 阅读:19 留言:0更新日期:2020-05-23 00:25
本申请实施例公开了一种降噪方法及装置,其中方法包括:通过基于频域构建的深度学习训练模型对训练数据的时域特征值和目标值进行训练,服务器可以将得到的模型参数发送给终端设备,以使终端设备接收到该模型参数后,对第一语音降噪模型的参数进行更新,并使用更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。本申请实施例中,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。

A noise reduction method and device

【技术实现步骤摘要】
一种降噪方法及装置
本申请涉及通信
,尤其涉及一种降噪方法及装置。
技术介绍
现实生活中,用户发出的语音信息中通常含有噪声,比如,环境中的风声、汽车声、机器运转的声音等。在用户使用语音装置进行通话的过程中,这些噪声可能会影响用户的通话质量,使得用户的体验不好。举个例子,用户A和用户B通过终端设备(比如手机)进行通话,若用户A通过手机a发出的语音信息中包含的噪声较大,可能会使得用户B通过手机b无法正常获取到用户A的语音信息,比如获取到的语音信息不够清晰,或者获取不到用户A发出的语音信息。因此,目前亟需一种降噪方法,用以解决因存在噪声而导致用户之间通话质量较低的技术问题。
技术实现思路
本申请实施例提供一种降噪方法及装置,用以解决因存在噪声而导致用户之间通话质量较低的技术问题。本申请实施例提供的一种降噪方法,包括:服务器获取训练数据,所述训练数据包括在第一环境中收集的第一语音信息和在第二环境中收集的第二语音信息,所述第一环境中的噪声小于等于预设阈值,所述第二环境中的噪声大于所述预设阈值;所述服务器根据所述训练数据,确定所述训练数据的时域特征值和目标值;所述训练数据的时域特征值包括噪声阈值、长时能量值、短时能量值和噪声包络跟踪值中的一项或多项;所述训练数据的目标值包括所述第一语音信息的语音活动检测值和/或所述第二语音信息的全带信噪比;所述服务器基于频域构建的深度学习训练模型,对所述时域特征值和所述目标值进行训练,得到模型参数,并将所述模型参数发送给终端设备;所述模型参数用于所述终端设备对用户输入的语音信息进行降噪处理。本申请实施例提供的一种降噪方法,包括:终端设备接收服务器发送的模型参数;所述终端设备根据所述模型参数,对所述终端设备中的第一语音降噪模型的参数进行更新,得到更新后的第一语音降噪模型;所述终端设备在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行降噪处理。可选地,所述终端设备接收服务器发送的模型参数之后,还包括:所述终端设备将预设标志更新为第一指示值;所述终端设备得到更新后的第一语音降噪模型之后,还包括:所述终端设备将所述预设标志更新为第二指示值。可选地,所述终端设备在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行更新之前,还包括:所述终端设备确定所述预设标志为所述第二指示值。可选地,所述方法还包括:所述终端设备在接收到用户输入的语音信息后,若确定所述预设标志为所述第一指示值,则使用所述终端设备中的第二语音降噪模型对所述语音信息进行降噪处理;所述第二语音降噪模型为所述第一语音降噪模型的备用模型。本申请实施例提供的一种服务器,该服务器包括:获取模块,用于获取训练数据,所述训练数据包括在第一环境中收集的第一语音信息和在第二环境中收集的第二语音信息,所述第一环境中的噪声小于等于预设阈值,所述第二环境中的噪声大于所述预设阈值;确定模块,用于根据所述训练数据,确定所述训练数据的时域特征值和目标值,所述训练数据的时域特征值包括噪声阈值、长时能量值、短时能量值和噪声包络跟踪值中的一项或多项;所述训练数据的目标值包括所述第一语音信息的语音活动检测值和/或所述第二语音信息的全带信噪比;处理模块,用于基于频域构建的深度学习训练模型,对所述时域特征值和所述目标值进行训练,得到模型参数,并将所述模型参数发送给终端设备,以使所述终端设备使用所述模型参数对用户输入的语音信息进行降噪处理。本申请实施例提供的一种终端设备,该终端设备包括:收发模块,用于接收服务器发送的模型参数;更新模块,用于根据所述模型参数,对所述终端设备中的第一语音降噪模型的参数进行更新,得到更新后的第一语音降噪模型;降噪模块,用于在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行降噪处理。可选地,在所述收发模块接收到服务器发送的模型参数之后,所述更新模块还用于:将预设标志更新为第一指示值,以及在得到更新后的第一语音降噪模型之后,将所述预设标志更新为第二指示值。可选地,所述降噪模块还用于:确定所述预设标志为所述第二指示值。可选地,所述降噪模块还用于:在接收到用户输入的语音信息后,若确定所述预设标志为所述第一指示值,则使用所述终端设备中的第二语音降噪模型对所述语音信息进行降噪处理;所述第二语音降噪模型为所述第一语音降噪模型的备用模型。本申请的上述实施例中,服务器通过将收集到的第一环境(噪声小于等于预设阈值)中的第一语音信息和第二环境(噪声大于预设阈值)中的第二语音信息作为训练数据,并在确定训练数据的时域特征值和目标值后,基于频域构建的深度学习训练模型对时域特征值和目标值进行训练,得到模型参数,以及将模型参数发送给终端设备,使得终端设备可以在接收到服务器发送的模型参数后,对终端设备中的第一语音降噪模型的参数进行更新,并可以使用更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。本申请实施例中,通过获取训练数据的时域特征值(可以体现时域特征)和目标值,并采用基于频域构建的深度学习训练模型(可以体现频域特征)对训练数据的时域特征值和目标值进行训练,可以在训练模型的过程中将语音信息的时域特征和频域特征进行结合,进而提升深度学习训练模型的训练性能,加快深度学习训练模型的训练速度;且,由于训练数据可以包括多种环境下的语音信息,并可以多次采用不同的训练数据对深度学习训练模型进行训练,因此可以得到比较准确的模型参数;进一步地,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。此外,采用深度学习训练模型对训练数据进行训练获取模型参数的过程和终端设备对用户语音信息的降噪过程可以并行处理,从而能够提高语音降噪的处理速度和处理效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种可能的系统架构示意图;图2为本申请实施例提供的一种降噪方法对应的流程示意图;图3为本申请实施例中提供的一种服务器的结构示意图;图4为本申请实施例中提供的一种终端设备的结构示意图。具体实施方式为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获本文档来自技高网...

【技术保护点】
1.一种降噪方法,其特征在于,所述方法包括:/n服务器获取训练数据,所述训练数据包括在第一环境中收集的第一语音信息和在第二环境中收集的第二语音信息,所述第一环境中的噪声小于等于预设阈值,所述第二环境中的噪声大于所述预设阈值;/n所述服务器根据所述训练数据,确定所述训练数据的时域特征值和目标值;所述训练数据的时域特征值包括噪声阈值、长时能量值、短时能量值和噪声包络跟踪值中的一项或多项;所述训练数据的目标值包括所述第一语音信息的语音活动检测值和/或所述第二语音信息的全带信噪比;/n所述服务器基于频域构建的深度学习训练模型,对所述时域特征值和所述目标值进行训练,得到模型参数,并将所述模型参数发送给终端设备,所述模型参数用于所述终端设备对用户输入的语音信息进行降噪处理。/n

【技术特征摘要】
1.一种降噪方法,其特征在于,所述方法包括:
服务器获取训练数据,所述训练数据包括在第一环境中收集的第一语音信息和在第二环境中收集的第二语音信息,所述第一环境中的噪声小于等于预设阈值,所述第二环境中的噪声大于所述预设阈值;
所述服务器根据所述训练数据,确定所述训练数据的时域特征值和目标值;所述训练数据的时域特征值包括噪声阈值、长时能量值、短时能量值和噪声包络跟踪值中的一项或多项;所述训练数据的目标值包括所述第一语音信息的语音活动检测值和/或所述第二语音信息的全带信噪比;
所述服务器基于频域构建的深度学习训练模型,对所述时域特征值和所述目标值进行训练,得到模型参数,并将所述模型参数发送给终端设备,所述模型参数用于所述终端设备对用户输入的语音信息进行降噪处理。


2.一种降噪方法,其特征在于,所述方法包括:
终端设备接收服务器发送的模型参数;
所述终端设备根据所述模型参数,对所述终端设备中的第一语音降噪模型的参数进行更新,得到更新后的第一语音降噪模型;
所述终端设备在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行降噪处理。


3.根据权利要求2所述的方法,其特征在于,所述终端设备接收服务器发送的模型参数之后,还包括:
所述终端设备将预设标志更新为第一指示值;
所述终端设备得到更新后的第一语音降噪模型之后,还包括:
所述终端设备将所述预设标志更新为第二指示值。


4.根据权利要求3所述的方法,其特征在于,所述终端设备在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行更新之前,还包括:
所述终端设备确定所述预设标志为所述第二指示值。


5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
所述终端设备在接收到用户输入的语音信息后,若确定所述预设标志为所述第一指示值,则使用所述终端设备中的第二语音降噪模型对所述语音信息进行降噪处理;所述第二语音...

【专利技术属性】
技术研发人员:宋钦梅方华袁其政屈跃强程宝平
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1