【技术实现步骤摘要】
一种语音识别、及语音识别模型训练方法及装置
本专利技术涉及计算机
,尤其涉及一种语音识别、及语音识别模型训练方法及装置。
技术介绍
实际中,在智能语音交互场景中,尤其是远讲条件下,通常会出现不同说话人语音混叠的情况,目前针对混合语音中目标说话人的语音提取研究越来越受到重视。现有技术中,语音识别方法主要为,采用深度吸引网络,为混合语音中每个说话人的语音生成一个吸引子,然后通过计算嵌入向量离这些吸引子的距离,来估计对应的时频窗口归属于相应说话人的掩码(mask)权重,从而根据掩码权重,将各个说话人的语音区分开。但是,现有技术中的语音识别方法,需要预先知道或估计混合语音中说话人的数目,将不同说话人的语音区分开来,但不能跟踪和提取某一目标说话人的语音。
技术实现思路
本专利技术实施例提供一种语音识别、及语音识别模型训练方法及装置,以解决现有技术中语音识别准确性较低,并且不能跟踪和识别某一目标说话人的问题。本专利技术实施例提供的具体技术方案如下:本专利技术一个实施例提供了一种语音识别方法,包括:从混合语音中识别出目标词语音,并基于所述目标词语音获得目标词语音的锚提取特征, ...
【技术保护点】
1.一种语音识别方法,其特征在于,包括:从混合语音中识别出目标词语音,并基于所述目标词语音获得目标词语音的锚提取特征,将所述目标词语音的锚提取特征作为目标语音的锚提取特征;根据所述目标语音的锚提取特征,获得所述目标语音的掩码;根据所述目标语音的掩码,识别出所述目标语音。
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:从混合语音中识别出目标词语音,并基于所述目标词语音获得目标词语音的锚提取特征,将所述目标词语音的锚提取特征作为目标语音的锚提取特征;根据所述目标语音的锚提取特征,获得所述目标语音的掩码;根据所述目标语音的掩码,识别出所述目标语音。2.如权利要求1所述的方法,其特征在于,从混合语音中识别出目标词语音,并基于所述目标词语音获得目标词语音的锚提取特征,将所述目标词语音的锚提取特征作为目标语音的锚提取特征,具体包括:确定混合语音的每个时频窗口对应的嵌入向量;根据确定的各嵌入向量和预设锚提取特征,确定所述各嵌入向量分别对应的目标词标注信息;根据所述各嵌入向量、所述预设锚提取特征和所述对应的目标词标注信息,获得目标词语音的锚提取特征,将所述目标词语音的锚提取特征作为目标语音的锚提取特征。3.如权利要求2所述的方法,其特征在于,根据所述目标语音的锚提取特征,获得所述目标语音的掩码,具体包括:根据所述各嵌入向量和所述目标语音的锚提取特征,获得所述各嵌入向量对应的规整嵌入向量;根据各规整嵌入向量和预设规整锚提取特征,获得所述目标语音的掩码。4.如权利要求2所述的方法,其特征在于,确定混合语音的每个时频窗口对应的嵌入向量,具体包括:对所述混合语音进行短时傅里叶变换,获得所述混合语音的频谱;将所述混合语音的频谱映射到固定维度原始嵌入空间中,获得所述混合语音的每个时频窗口对应的嵌入向量。5.如权利要求2所述的方法,其特征在于,根据确定的各嵌入向量和预设锚提取特征,确定所述各嵌入向量分别对应的目标词标注信息,具体包括:分别将各嵌入向量和预设锚提取特征进行合并;将各合并后的向量输入到预先训练的第一前向网络;获得所述第一前向网络对各合并后的向量进行识别后输出的各嵌入向量对应的目标词标注信息,其中,不包括目标词语音的嵌入向量对应的目标词标注信息取值为0,包括目标词语音的嵌入向量对应的目标词标注信息取值为1。6.如权利要求3所述的方法,其特征在于,根据所述各嵌入向量和所述目标语音的锚提取特征,获得所述各嵌入向量对应的规整嵌入向量,具体包括:分别将所述各嵌入向量和所述目标语音的锚提取特征进行合并,获得各合并后的2K维向量;其中,所述嵌入向量和所述目标语音的锚提取特征分别为K维向量;将各合并后的2K维向量输入到预先训练的第二前向网络;基于所述第二前向网络,将各合并后的2K维向量再次映射到固定维度规整嵌入空间中,获得所述第二前向网络输出的相应的K维向量,并将输出的K维向量作为相应的嵌入向量的规整嵌入向量;其中,第二前向网络用于将原始嵌入空间映射到规整嵌入空间。7.如权利要求3所述的方法,其特征在于,根据各规整嵌入向量和预设规整锚提取特征,获得所述目标语音的掩码,具体包括:分别计算各规整嵌入向量和预设规整锚提取特征之间的距离,根据各距离取值获得所述目标语音的掩码。8.如权利要求1所述的方法,其特征在于,进一步包括:根据识别出的目标语音,输入到预先训练的目标词判断模块,判断所述目标语音中是否包括目标词语音,若判断包括目标词语音,则调整预设调节参数,使计算出的目标语音的锚提取特征中所述预设锚提取特征权重减小,若判断不包...
【专利技术属性】
技术研发人员:王珺,苏丹,俞栋,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。