【技术实现步骤摘要】
语音增强评测方法、语音增强评测模型的训练方法和装置
[0001]本公开涉及语音增强
,尤其涉及一种语音增强评测方法、语音增强评测模型的训练方法和装置。
技术介绍
[0002]语音增强模型是用于从含噪语音中提取尽可能纯净的原始语音的模型,但实际应用中,任何语音增强模型都会误剪切语音和(或)残留噪音,所以需要一个评测方法来评估误剪切语音和残留噪音的程度。为此,需要将待测语音增强模型输出的信号分离成语音成分和残留噪声成分两部分,以便后续进一步进行性能分析。
[0003]相关技术中存在基于SI
‑
SNR(Scale
‑
Invariant Source
‑
to
‑
Noise Ratio,尺度不变的信噪比)的评测方法,可以在求SI
‑
SNR的过程中,将待测语音增强模型估计的信号中的语音成分和残留噪声成分分离出来。但该方式存在一个缺点,就是当估计的信号经过AGC(Automatic Gain Control,自动控制增益)之后,再用该方 ...
【技术保护点】
【技术特征摘要】
1.一种语音增强评测方法,用于评测语音增强模型,其特征在于,所述语音增强评测方法包括:获取含噪语音样本,所述含噪语音样本包括原始语音样本和原始噪声样本;将所述含噪语音样本输入待测语音增强模型,得到增强含噪语音;将所述增强含噪语音、所述原始语音样本和所述原始噪声样本输入语音增强评测模型,得到预估增强语音和预估增强噪声;根据所述预估增强语音和所述预估增强噪声,确定所述待测语音增强模型的评测值。2.如权利要求1所述的语音增强评测方法,其特征在于,所述将所述增强含噪语音、所述原始语音样本、所述原始噪声样本输入语音增强评测模型,得到预估增强语音和预估增强噪声,包括:将所述增强含噪语音、所述原始语音样本、所述原始噪声样本输入所述语音增强评测模型,得到所述预估增强语音和所述预估增强噪声中的一个;从所述增强含噪语音中去除所述预估增强语音和所述预估增强噪声中的一个,得到所述预估增强语音和所述预估增强噪声中的另一个。3.如权利要求1所述的语音增强评测方法,其特征在于,所述根据所述预估增强语音和所述预估增强噪声,确定所述待测语音增强模型的评测值,包括:根据所述预估增强语音和所述预估增强噪声,确定所述增强含噪语音的信噪比,作为所述待测语音增强模型的评测值。4.如权利要求3所述的语音增强评测方法,其特征在于,所述增强含噪语音、所述预估增强语音和所述预估增强噪声均包括多帧频域信号,每帧频域信号包括多个中心频率下的复数信号,其中,所述根据所述预估增强语音和所述预估增强噪声,确定所述增强含噪语音的信噪比,包括:分别确定所述预估增强语音和所述预估增强噪声在每帧的所有中心频率的振幅之和,作为所述增强含噪语音在相应帧的语音能量和噪声能量;根据所述增强含噪语音在每帧的语音能量和噪声能量的比值,确定所述增强含噪语音在相应帧的信噪比;确定所述增强含噪语音在各个帧的信噪比的统计值,作为所述增强含噪语音的信噪比。5.一种语音增强评测模型的训练方法,其特征在于,所述训练方法包括:获取原始语音样本和原始噪声样本;对所述原始语音样本和所述原始噪声样本分别进行增强处理,得到增强语音样本和增强噪声样本;合并所述增强语音样本和所述增强噪声样本,得到增强样本;将所述增强样本、所述原始语音样本、所述原始噪声样本输入所述语音增强评测模型,得到预估增强语音和预估增强噪声中的至少一个;根据所述预估增强语音和所述增...
【专利技术属性】
技术研发人员:任新蕾,马珊,郑羲光,罗必达,张晨,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。