声学模型训练方法和装置、电子设备、计算机可读介质制造方法及图纸

技术编号:21365265 阅读:41 留言:0更新日期:2019-06-15 10:10
本公开提供了一种声学模型训练方法,该方法包括:获取精标数据的语音特征和普通数据的语音特征,其中,精标数据是指标注后得到的数据,普通数据是指未标注的数据,根据精标数据的语音特征和预设的网络模型确定单输入模型,根据单输入模型、精标数据的语音特征和普通数据的语音特征确定双输入声学模型。本公开还提供了一种声学模型训练装置、电子设备、计算机可读介质。

Acoustic model training methods and devices, electronic equipment, computer readable media

The present disclosure provides an acoustic model training method, which includes acquiring speech features of refined data and voice features of ordinary data. Among them, refined data refers to data acquired after labeling and ordinary data refers to data not labeled. A single input model is determined according to the voice characteristics of refined data and the preset network model, and a single input model and refined data are based on the single input model and refined data. The two-input acoustic model is determined by the speech features and the speech features of common data. The present disclosure also provides an acoustic model training device, an electronic device and a computer readable medium.

【技术实现步骤摘要】
声学模型训练方法和装置、电子设备、计算机可读介质
本公开实施例涉及互联网
,特别涉及声学模型训练方法和装置、电子设备、计算机可读介质。
技术介绍
随着互联网和语音技术的发展,声学模型的训练的相关技术逐渐被重视。其中,语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言,是一种方便的人机交互方式。声学模型的准确率决定了语音识别的正确性和效果。在现有技术中,声学模型的训练方法为:获取所有数据对应的音频,基于音频提取所有数据对应的特征,并结合单输入声学模型进行训练,对训练后的模型进行解码测试。
技术实现思路
本公开实施例提供声学模型训练方法和装置、电子设备、计算机可读介质。第一方面,本公开实施例提供了一种声学模型训练方法,包括:获取精标数据的语音特征和普通数据的语音特征,其中,所述精标数据是指标注后得到的数据,所述普通数据是指未标注的数据;根据所述精标数据的语音特征和预设的网络模型确定单输入模型;根据所述单输入模型、所述精标数据的语音特征和所述普通数据的语音特征确定双输入声学模型。在一些实施例中,所述根据所述单输入模型、所述精标数据的语音特征和所述普通本文档来自技高网...

【技术保护点】
1.一种声学模型训练方法,包括:获取精标数据的语音特征和普通数据的语音特征,其中,所述精标数据是指标注后得到的数据,所述普通数据是指未标注的数据;根据所述精标数据的语音特征和预设的网络模型确定单输入模型;根据所述单输入模型、所述精标数据的语音特征和所述普通数据的语音特征确定双输入声学模型。

【技术特征摘要】
1.一种声学模型训练方法,包括:获取精标数据的语音特征和普通数据的语音特征,其中,所述精标数据是指标注后得到的数据,所述普通数据是指未标注的数据;根据所述精标数据的语音特征和预设的网络模型确定单输入模型;根据所述单输入模型、所述精标数据的语音特征和所述普通数据的语音特征确定双输入声学模型。2.根据权利要求1所述的方法,其中,所述根据所述单输入模型、所述精标数据的语音特征和所述普通数据的语音特征确定双输入声学模型,包括:对所述单输入模型进行复制和合并,得到双输入初始模型;采用所述精标数据的语音特征和所述普通数据的语音特征对所述双输入初始模型进行训练,得到所述双输入声学模型。3.根据权利要求2所述的方法,其中,所述对所述单输入模型进行复制和合并,得到双输入初始模型,包括:对所述单输入模型的输入层进行复制,将复制后的输入层和所述单输入模型合并,得到所述双输入初始模型。4.根据权利要求3所述的方法,其中,所述单输入模型包括数据采集层和隐层,所述将复制后的输入层和所述单输入模型合并,包括:将复制后的输入层和所述单输入模型中的输入层共用所述单输入模型中的数据采集层和隐层。5.根据权利要求1至4中任一项所述的方法,其中,在根据所述单输入模型、所述精标数据的语音特征和所述普通数据的语音特征确定双输入声学模型之后,还包括:将所述双输入声学模型拆解为两个单输入模型;选取包括用于输入所述精标数据的语音特征的输入层的单输入模型;采用所述精标数据的语音特征对选取出的单输入模型进行训练,得到声学模型。6.根据权利要求1至4中任一项所述的方法,其中,在所述获取精标数据的语音特征和普通数据的语音特征之前,还包括:获取初始精标数据和初始普通数据;分别获取所述初始精标数据和所述初始普通数据的音频,并分别从所述初始精标数据的音频中提取所述初始精标数据的语音特征,从所述初始普通数据的音频中提取所述初始普通数据的语音特征;基于所述初始精标数据、所述初始普通数据、所述初始精标数据的语音特征和所述初始普通数据的语音特征构建训练列表;所述获取精标数据的语音特征和普通数据的语音特征包括:根据精标数据从所述训练列表的所述初始精标数据的语音特征中获取精标数据的语音特征,并根据普通数据从所述训练列表的所述初始普通数据的语音特征中获取普通数据的语音特征。7.根据权利要求1至4中任一项所述的方法,其中,所述根据所述精标数据的语音特征和预设的网络模型确定单输入模型,包括:采用所述精标数据的语音特征对预设的网络模型依次进行帧级别训练和句子级别训练,得到所述单输入模型。8.一种声学模型训练装置,包括:获取模块,用于获取精标数据的语音特征和普通数据的语音特征...

【专利技术属性】
技术研发人员:孙建伟
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1