【技术实现步骤摘要】
一种语音建模方法及装置
本专利技术涉及语音识别领域,特别是涉及一种语音建模方法及装置。
技术介绍
语音识别技术作为人工智能的关键技术之一,能够将输入的语音信号转变成文字信号,进而方便存储,检索和传播。近年来随着移动互联网的兴起和深度神经网络技术在语音识别技术中的快速发展,语音识别技术在简单场景下的识别性能大幅提升。例如,语音识别技术在搜索引擎,输入法,故事机等简单场景下的产品领域中被广泛使用,而在复杂场景下的产品领域如车载,智能家居等,语音识别性能随着场景复杂度上升而快速下降。传统语音识别采用音素混合高斯-隐马尔科夫模型(以下简称HMM-GMM模型)对语音信号进行建模。近年来随着深度学习技术的快速发展,基于深度学习的语音识别系统受到越来越多的关注。隐马尔科夫-深度神经网络混合模型(以下简称HMM-DNN模型)的提出大幅度提升语音识别的准确度。隐马尔科夫-深度神经网络采用监督学习的方式,利用其强大的非线性拟合能力,从原始数据中挖掘出更加适合分类的特征表达形式,建立起语音特征序列到音素对齐序列的映射,进而提高语音识别准确度。语音识别在实际应用中往往会面临非常复杂的目标 ...
【技术保护点】
1.一种语音建模方法,其特征在于,所述方法包括:获取在简单场景下录制的第一语音信号;获取所述第一语音信号的第一音素对齐序列;向所述第一语音信号添加信道畸变、混响和噪声,生成仿真语音信号;对所述仿真语音信号中的非语音段进行分类,并对每一类分别建立对应的一个用于建模的目标音素;根据所述仿真语音信号中的噪声类别,将所述仿真语音信号中的第二音素对齐序列中的非语音段噪声音素分别替换成对应的所述目标音素;其中,所述第二音素对齐序列与所述第一音素对齐序列相同;基于替换后的所述仿真语音信号生成目标声学模型。
【技术特征摘要】
1.一种语音建模方法,其特征在于,所述方法包括:获取在简单场景下录制的第一语音信号;获取所述第一语音信号的第一音素对齐序列;向所述第一语音信号添加信道畸变、混响和噪声,生成仿真语音信号;对所述仿真语音信号中的非语音段进行分类,并对每一类分别建立对应的一个用于建模的目标音素;根据所述仿真语音信号中的噪声类别,将所述仿真语音信号中的第二音素对齐序列中的非语音段噪声音素分别替换成对应的所述目标音素;其中,所述第二音素对齐序列与所述第一音素对齐序列相同;基于替换后的所述仿真语音信号生成目标声学模型。2.根据权利要求1所述的方法,其特征在于,所述基于替换后的所述仿真语音信号生成目标声学模型,包括:计算替换后的所述仿真语音信号的梅尔滤波器特征;对第三音素对齐序列和所述梅尔滤波器特征进行聚类,对相似三音素状态进行绑定,生成单状态三音素模型决策树;其中,所述第三音素对齐序列由将所述第二音素对齐序列中的非语音段噪声音素分别替换成对应的所述目标音素后形成;基于所述单状态三音素模型决策树将所述第三音素对齐序列转化为隐马尔科夫绑定状态ID序列;采用三状态三音素HMM-DNN模型建立所述梅尔滤波器特征到所述隐马尔科夫绑定状态ID序列之间的映射;对所述HMM-DNN模型中的权值进行迭代训练更新后生成目标声学模型。3.根据权利要求1所述的方法,其特征在于,所述获取所述第一语音信号的第一音素对齐序列,包括:计算所述第一语音信号的梅尔倒谱系数;对所述梅尔倒谱系数进行均值归一化并计算所述梅尔倒谱系数的一阶和二阶差分特征;采用三状态三音素HMM-GMM模型对所述梅尔倒谱系数及所述梅尔倒谱系数的一阶和二阶差分特征进行建模,生成三音素隐马尔科夫模型的决策树;对所述三音素隐马尔科夫模型进行迭代训练,生成需要的目标三音素隐马尔科夫模型;基于所述目标三音素隐马尔科夫模型生成所述第一语音信号的第一音素对齐序列。4.根据权利要求3所述的方法,其特征在于,所述对所述三音素隐马尔科夫模型进行迭代训练,生成需要的目标三音素隐马尔科夫模型,包括:对所述三状态三音素HMM-GMM模型中的高斯模型数目进行增长,直到最终所述目标三音素隐马尔科夫模型中的每个隐马尔科夫模型状态上高斯数的数目达到24;对所述目标三音素隐马尔科夫模型进行迭代训练,直到所述目标三音素隐马尔科夫模型的模型似然度数值增长幅度小于设定阈值。5.根据权利要求1所述的方法,其特征在于,所述向所述第一语音信号添加信道畸变、混响和噪声,生成仿真语音信号,包括:采用人工嘴发射指数扫频信号,并由目标麦克风对所述指数扫频信号进行采集形成目标采集信号;基于所述目标采集信号确定所述目标麦克风的信道传递函数;生成在目标复杂场景下的仿真混响传递函数;采用所述目标麦克风录制在所述目标复杂场景下不同类型的噪声;基于所述信道传递函数、仿真混响传递函数和不同类型的噪声,向所述第一语音信号添加信道畸变、...
【专利技术属性】
技术研发人员:唐浩元,王佳珺,王欢良,马殿昌,
申请(专利权)人:苏州奇梦者网络科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。