语音质检的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:34107492 阅读:20 留言:0更新日期:2022-07-12 00:44
本发明专利技术实施例提供了一种语音质检的方法、装置、电子设备和存储介质。该方法包括:获取待质检的音频信号;提取音频信号的第一语音特征和第二语音特征,其中第二语音特征包括频谱信息;对第一语音特征进行编码,以获得第一语音特征的时域表示;对第二语音特征进行编码,以获得频谱信息的频域表示;合并时域表示和频域表示,以作为编码输出数据;将编码输出数据进行解码;基于解码结果,确定音频信号的分数。由此,避免了背景噪声对语音质检的干扰,显著提高了语音质检的准确性。高了语音质检的准确性。高了语音质检的准确性。

【技术实现步骤摘要】
语音质检的方法、装置、电子设备和存储介质


[0001]本专利技术涉及语音分析和处理领域,更具体地涉及一种语音质检的方法、装置、电子设备和存储介质。

技术介绍

[0002]近年来,伴随神经网络技术的进步,语音技术逐渐成熟,被应用到各行业。例如,由于神经网络基本依靠数据驱动,所以催生了众多数据公司。数据公司找专职人员录音后,需要对语音进行质检。依靠人力进行语音质检会浪费巨大的时间、精力、财力,依靠技术进行自动质检迫在眉睫。
[0003]目前语音质检技术通常通过标准文字对比来确定音频信号的准确性。具体地,首先,提取待质检的音频信号的单一声学特征;然后基于该声学特征确定音频信号相对于标准文字的正常发音之间的差异,进而确定质检结果。该质检结果的准确性难以保证。
[0004]所以,亟要一种新的语音质检的技术,可以解决上述问题。

技术实现思路

[0005]考虑到上述问题而提出了本专利技术。
[0006]根据本专利技术一个方面,提供了一种语音质检的方法。该方法包括:
[0007]获取待质检的音频信号;
[0008]提取所述音频信号的第一语音特征和第二语音特征,其中所述第二语音特征包括频谱信息;
[0009]对所述第一语音特征进行编码,以获得所述第一语音特征的时域表示;
[0010]对所述第二语音特征进行编码,以获得所述频谱信息的频域表示;
[0011]合并所述时域表示和所述频域表示,以作为编码输出数据;
[0012]将所述编码输出数据进行解码;<br/>[0013]基于解码结果,确定所述音频信号的分数。
[0014]示例性地,所述将所述编码输出数据进行解码包括:
[0015]将所述编码输出数据输入解码器,以利用所述解码器基于语音字典确定所述音频信号中的语音帧发音为所述语音字典中的每个字的概率,其中,所述语音字典中包括多组字,每组字包括分别与多个不同质量的语音对应的、同一字的不同变体;
[0016]基于解码结果确定所述音频信号的分数包括:
[0017]基于所确定的概率,确定所述音频信号中的语音帧所实际对应的字;
[0018]基于所述音频信号中的语音帧所实际对应的字,确定语音帧所对应的分数;
[0019]基于语音帧所对应的分数,确定所述音频信号的分数。
[0020]示例性地,所述解码器包括并联的第一解码器和第二解码器,
[0021]所述将所述编码输出数据输入解码器,以利用所述解码器基于所述语音字典确定所述音频信号中的语音帧发音为所述语音字典中的每个字的概率,包括:
[0022]将所述编码输出数据输入所述第一解码器,以确定语音帧与所述语音字典中的每个字分别对应的第一概率;
[0023]将所述编码输出数据输入所述第二解码器,以确定语音帧与所述语音字典中的每个字分别对应的第二概率;
[0024]所述基于所确定的概率确定所述音频信号中的语音帧所实际对应的字包括:
[0025]基于所述第一概率和所述第二概率确定所述音频信号中的语音帧所实际对应的字。
[0026]示例性地,所述基于所述第一概率和所述第二概率确定所述音频信号中的语音帧所实际对应的字,包括:
[0027]对于所述语音字典中的每个字,基于以下公式计算语音帧与该字对应的字概率P
w
,P
w
=a*P
ctc
+(1

a)*P
att
其中,a表示语音帧与该字对应的第一概率的权重,P
ctc
表示语音帧与该字对应的第一概率,P
att
表示语音帧与该字对应的第二概率;
[0028]比较所述语音字典中每个字的字概率,以确定最大的字概率所对应的字并将所确定的字作为与语音帧实际对应的字。
[0029]示例性地,所述语音字典中的每组字中的不同字对应不同的分数段,所述确定语音帧所对应的分数包括:
[0030]基于所述音频信号中的语音帧所实际对应的字,确定语音帧所对应的分数段;以及
[0031]基于语音帧与该语音帧所实际对应的字对应的概率,确定该语音帧对应的分数。
[0032]示例性地,所述方法还包括:
[0033]将待定音频信号和对应的标准文本输入语音评测系统,以获得所述语音评测系统针对所述待定音频信号的评测质量;
[0034]基于所述评测质量,确定所述语音字典中的多组字,以获得所述语音字典。
[0035]示例性地,在所述基于解码结果确定所述音频信号的分数之前,所述方法还包括:
[0036]获取测评音频信号;
[0037]提取所述测评音频信号的第一语音特征和第二语音特征,其中所述第二语音特征包括频谱信息;
[0038]对所述测评音频信号的第一语音特征进行编码,以获得所述测评音频信号的第一语音特征的时域表示;
[0039]对所述测评音频信号的第二语音特征进行编码,以获得所述测评音频信号的频谱信息的频域表示;
[0040]合并所述测评音频信号的第一语音特征的时域表示和所述测评音频信号的频谱信息的频域表示,以作为所述测评音频信号的编码输出数据;
[0041]将所述测评音频信号的编码输出数据进行解码;
[0042]基于解码结果,确定所述测评音频信号的基础分数;
[0043]接收所述测评音频信号的理想分数;
[0044]基于所述测评音频信号的基础分数和理想分数,拟合基础分数与理想分数之间的关系;
[0045]所述基于解码结果确定所述音频信号的分数包括:
[0046]基于所述解码结果确定所述音频信号的基础分数;
[0047]基于所述音频信号的基础分数和所拟合的关系,确定所述音频信号的实际分数。
[0048]示例性地,所述提取所述音频信号的第一语音特征包括:
[0049]提取所述音频信号的声学特征;
[0050]确定所述音频信号的能量信息;
[0051]基于所述声学特征和所述能量信息确定所述音频信号的第一语音特征。
[0052]示例性地,对于所述音频信号的每一帧,该帧的所述声学特征用N维特征向量表示,所述能量信息用能量数值表示,
[0053]所述基于所述声学特征和所述能量信息确定该帧的第一语音特征包括:
[0054]将所述能量数值附加在所述N维特征向量的第一个元素之前或者最后一个元素之后,以将所获得的N+1维特征向量作为该帧的第一语音特征。
[0055]示例性地,所述时域表示用第一特征向量表示,所述频域表示用第二特征向量表示,
[0056]所述合并所述时域表示和所述频域表示包括:
[0057]将所述第一特征向量和所述第二特征向量进行连接操作,以获得所述第一特征向量和第二特征向量的连接向量作为所述编码输出数据。
[0058]根据本专利技术另一方面,还提供了一种语音质检的装置,包括:
[0059]获取模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音质检的方法,其特征在于,包括:获取待质检的音频信号;提取所述音频信号的第一语音特征和第二语音特征,其中所述第二语音特征包括频谱信息;对所述第一语音特征进行编码,以获得所述第一语音特征的时域表示;对所述第二语音特征进行编码,以获得所述频谱信息的频域表示;合并所述时域表示和所述频域表示,以作为编码输出数据;将所述编码输出数据进行解码;基于解码结果,确定所述音频信号的分数。2.如权利要求1所述的方法,其中,所述将所述编码输出数据进行解码包括:将所述编码输出数据输入解码器,以利用所述解码器基于语音字典确定所述音频信号中的语音帧发音为所述语音字典中的每个字的概率,其中,所述语音字典中包括多组字,每组字包括分别与多个不同质量的语音对应的、同一字的不同变体;基于解码结果确定所述音频信号的分数包括:基于所确定的概率,确定所述音频信号中的语音帧所实际对应的字;基于所述音频信号中的语音帧所实际对应的字,确定语音帧所对应的分数;基于语音帧所对应的分数,确定所述音频信号的分数。3.如权利要求2所述的方法,其中,所述解码器包括并联的第一解码器和第二解码器,所述将所述编码输出数据输入解码器,以利用所述解码器基于所述语音字典确定所述音频信号中的语音帧发音为所述语音字典中的每个字的概率,包括:将所述编码输出数据输入所述第一解码器,以确定语音帧与所述语音字典中的每个字分别对应的第一概率;将所述编码输出数据输入所述第二解码器,以确定语音帧与所述语音字典中的每个字分别对应的第二概率;所述基于所确定的概率确定所述音频信号中的语音帧所实际对应的字包括:基于所述第一概率和所述第二概率确定所述音频信号中的语音帧所实际对应的字。4.如权利要求3所述的方法,其中,所述基于所述第一概率和所述第二概率确定所述音频信号中的语音帧所实际对应的字,包括:对于所述语音字典中的每个字,基于以下公式计算语音帧与该字对应的字概率P
w
,P
w
=a*P
ctc
+(1

a)*P
att
其中,a表示语音帧与该字对应的第一概率的权重,P
ctc
表示语音帧与该字对应的第一概率,P
att
表示语音帧与该字对应的第二概率;比较所述语音字典中每个字的字概率,以确定最大的字概率所对应的字并将所确定的字作为与语音帧实际对应的字。5.如权利要求1至4任一项所述的方法,其中...

【专利技术属性】
技术研发人员:何梦中李秀林
申请(专利权)人:标贝北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1