【技术实现步骤摘要】
本申请涉及语音识别,具体涉及一种语音识别标签数据生成方法、装置及相关设备。
技术介绍
1、语音识别当前主流的技术基于深度神经网络(deep neural network,dnn),深度神经网络因其出色的分类能力和非线性关系的表达能力,被广泛的应用在语音识别声学和语言模型的建模过程中,极大的提升了语音识别的性能。
2、传统的hybrid语音识别建模包含声学和语言两部分,其中声学模型主要针对音频发音特征进行学习,语言模型针对语法规则进行学习。不论是声学模型还是语言模型,模型的性能表现都需要依赖于大量的标注训练数据来支撑。基于特定业务场景,比如电话客服,标注数据的来源一般有开源库、第三方公司成品库,针对业务数据购买第三方标注服务等方式。开源库和第三方公司成品库无论是在话术覆盖领域还是采集设备、信道环境与实际业务场景的音频特性均相距较远,若需要在业务数据场景下达到较好的性能,一般需要购买第三方标注服务以获得有标签的业务数据,这样需要消耗大量的人力和时间成本,并且在数量量级上远远不够。
3、因此,如何降低获取大量的高质量的
...【技术保护点】
1.一种语音识别标签数据生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的语音识别标签数据生成方法,其特征在于,所述判断所述单位长度混淆度,以及所述各词级别识别结果的多元语言概率是否符合数据保留要求,包括:
3.根据权利要求1所述的语音识别标签数据生成方法,其特征在于,所述获取所述多个词级别识别结果的单位长度混淆度,包括:
4.根据权利要求1所述的语音识别标签数据生成方法,其特征在于,所述基于所述多个词级别识别结果,确定所述目标音频数据的目标标签数据,包括:
5.根据权利要求1所述的语音识别标签数据生成方法,
...【技术特征摘要】
1.一种语音识别标签数据生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的语音识别标签数据生成方法,其特征在于,所述判断所述单位长度混淆度,以及所述各词级别识别结果的多元语言概率是否符合数据保留要求,包括:
3.根据权利要求1所述的语音识别标签数据生成方法,其特征在于,所述获取所述多个词级别识别结果的单位长度混淆度,包括:
4.根据权利要求1所述的语音识别标签数据生成方法,其特征在于,所述基于所述多个词级别识别结果,确定所述目标音频数据的目标标签数据,包括:
5.根据权利要求1所述的语音识别标签数据生成方法,其特征在于,所述解码数据还包括各词级别识别结果对应的时间戳以及置信度,所述对预先获取的音频业务数据进行解码,得到解...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。