语音标注方法、装置、设备以及存储介质制造方法及图纸

技术编号:30141879 阅读:33 留言:0更新日期:2021-09-23 15:06
本发明专利技术公开了一种语音标注方法,包括:获取目标语音;基于第一声学模型对所述目标语音进行分析,得到所述目标语音对应的第一标注数据;基于第二声学模型对所述目标语音进行分析,得到所述目标语音对应的第二标注数据;根据所述目标语音对应的第一标注数据和第二标注数据确定出所述目标语音对应的最终标注数据,以完成对所述目标语音的标注。可见,本发明专利技术能够利用不同声学模型之间的互补特性,提高语音标注的标注准确率,还能够避免传统的单个声学模型的标注过程中复杂的实验操作,提高语音标注的标注效率。本发明专利技术还涉及区块链技术领域。域。域。

【技术实现步骤摘要】
语音标注方法、装置、设备以及存储介质


[0001]本专利技术涉及语音信号处理
,尤其涉及一种语音标注方法、装置、计算机设备以及存储介质。

技术介绍

[0002]语音识别技术离不开语音语料库的标注,建设丰富、完整的语音语料库为语音识别技术的研究和实现提供了基础数据资源,所以语料库建设一直受到国内外研究机构和人员的重视。其中,对原始语料进行标注是构建语音语料库的关键一步,标注的完整性和准确性直接关系到语音识别的效果,但是受限于高昂的标注成本和主观标注的非客观性,高效获取准确的标注语料是非常困难的。目前,主流的标注方法分为人工标注和自动标注两种。然而,随着语音库规模的扩大,人工标注的工作量急剧增加,标注成本十分高昂;此外韵律标注具有一定主观性,保证不同标注人员之间标注结果的一致性较为困难。因此,如何通过计算机自动准确的进行语音语料库的标注已成为当前的一个重要研究方向。
[0003]无监督声学模型训练系统是目前自动语音标注的技术路线之一,它通过使用少量带标注的数据训练一个声学模型,然后使用该模型去识别更大规模的未标注训练数据,接着选择部分本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音标注方法,其特征在于,所述方法包括:获取目标语音;基于第一声学模型对所述目标语音进行分析,得到所述目标语音对应的第一标注数据,其中,所述第一标注数据记录有所述第一声学模型对所述目标语音的第一标注结果;基于第二声学模型对所述目标语音进行分析,得到所述目标语音对应的第二标注数据,其中,所述第二标注数据记录有所述第二声学模型对所述目标语音的第二标注结果;根据所述目标语音对应的第一标注数据和第二标注数据确定出所述目标语音对应的最终标注数据,以完成对所述目标语音的标注,其中,所述最终标注数据记录有所述目标语音的最终标注结果。2.根据权利要求1所述的语音标注方法,其特征在于,所述第一声学模型为GMM

HMM声学模型,所述第二声学模型为DNN声学模型。3.根据权利要求2所述的语音标注方法,其特征在于,所述DNN声学模型建立在从所述GMM

HMM模型获得的对齐基础之上,采用时滞神经网络对语音信号进行建模。4.根据权利要求2所述的语音标注方法,其特征在于,所述DNN声学模型包括一个输入层、六个个隐藏层和一个输出层;所述输入层具有3500个神经元,并且一次处理九帧语音信号;每个所述隐藏层具有1200个神经元;所述输出层具有1200个神经元。5.根据权利要求2所述的语音标注方法,其特征在于,所述DNN声学模型模型训练总共经5代,初始学习率为0.015,终止学习率为0.00015。6.根据权利要求1

5任一项所述的语音标注方法,其特征在于,所述获取目标语音,包括:获取原始的长语音;将所述长语音输入至基于PCA分析方法的语音活动监测器进行分析,以将所述长语音自动切分...

【专利技术属性】
技术研发人员:苏雪琦王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1