【技术实现步骤摘要】
声学模型训练方法和装置
本申请涉及计算机领域,具体涉及语音领域,尤其涉及声学模型训练方法和装置。
技术介绍
CTC(connectionisttemporalclassification,连接时序分类)准则被广泛应用于声学模型的训练和优化中。采用CTC准则对声学模型的训练中由于大量的高延迟搜索路径参与训练容易导致训练后的声学模型输出的状态序列具有滞后性。专利技术信息本申请提供了一种声学模型训练方法和装置,用于解决上述
技术介绍
部分存在的技术问题。第一方面,本申请提供了声学模型训练方法,该方法包括:去除在采用连接时序分类准则对声学模型进行训练时所有搜索路径中的高延迟搜索路径,所述高延迟搜索路径为具有状态的输出的延迟大于延迟阈值的搜索路径;基于除了所有搜索路径中的高延迟搜索路径之外的状态的输出的延迟小于延迟阈值的搜索路径,对所述声学模型进行训练。第二方面,本申请提供了声学模型训练装置,该装置包括:搜索路径去除单元,配置用于去除在采用连接时序分类准则对声学模型进行训练时所有搜索路径中的高延迟搜索路径,高延迟搜索路径为具有状态的输出的延迟大于延迟阈值的搜索路径;声学模型训练 ...
【技术保护点】
一种声学模型训练方法,其特征在于,所述方法包括:去除在采用连接时序分类准则对声学模型进行训练时所有搜索路径中的高延迟搜索路径,所述高延迟搜索路径为具有状态的输出的延迟大于延迟阈值的搜索路径;基于除了所有搜索路径中的高延迟搜索路径之外的状态的输出的延迟小于延迟阈值的搜索路径,对所述声学模型进行训练。
【技术特征摘要】
1.一种声学模型训练方法,其特征在于,所述方法包括:去除在采用连接时序分类准则对声学模型进行训练时所有搜索路径中的高延迟搜索路径,所述高延迟搜索路径为具有状态的输出的延迟大于延迟阈值的搜索路径;基于除了所有搜索路径中的高延迟搜索路径之外的状态的输出的延迟小于延迟阈值的搜索路径,对所述声学模型进行训练。2.根据权利要求1所述的方法,其特征在于,去除在采用连接时序分类准则对声学模型进行训练时所有搜索路径中的高延迟搜索路径包括:在采用连接时序分类准则对声学模型进行训练时加入强延迟控制约束条件,所述强延迟控制约束条件用于保留所有搜索路径中的状态的输出的延迟小于延迟阈值的搜索路径。3.根据权利要求2所述的方法,其特征在于,基于除了所有搜索路径中的高延迟搜索路径之外的状态的输出的延迟小于延迟阈值的搜索路径,对所述声学模型进行训练包括:采用连接时序分类准则以最大化状态的输出的延迟小于延迟阈值的搜索路径中的目标序列对应的搜索路径的概率和的方式优化声学模型,所述目标序列为与参考标注序列相同的预测标注序列。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:利用训练后的声学模型接收用户输入的语音,确定出最优搜索路径,所述最优搜索路径中的每一个状态的输出的延迟均小于延迟阈值。5.一种声学模型训练装置,其特征在于,所述装置包括:搜索路径去除单元,配置用于去除在采用连接时序分类准则对声学模型进行训练时所有搜索路径中的高延...
【专利技术属性】
技术研发人员:黄斌,李先刚,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。