音频数据的处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:42104647 阅读:24 留言:0更新日期:2024-07-25 00:29
本申请提供了一种音频数据的处理方法、装置、电子设备、计算机程序产品及计算机可读存储介质;方法包括:获取待识别的音频数据;对音频数据进行语音识别处理,得到候选识别结果;确定候选识别结果在语料库中存在同近音字符的同近音概率,其中,语料库包括多个字符以及对应的发音;基于同近音概率与概率阈值之间的比较结果,获取基于声学模型进行语音识别的目标识别方式;基于候选识别结果,调用声学模型按照目标识别方式确定音频数据对应的目标文本。通过本申请,能够提升语音识别的准确性。

【技术实现步骤摘要】

本申请涉及人工智能技术,尤其涉及一种音频数据的处理方法、装置、电子设备及存储介质


技术介绍

1、语音技术(speech technology)的关键技术有自动语音识别技术(asr)和语音合成技术(tts)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。

2、在语音识别的过程中,例如:针对中文进行语音识别,中文中存在大量的同音、近音文字,基于相同或相近的语音难以确定用户想要表达的实际内容,相关技术中暂无较好的方式能够提升语音识别的准确性。


技术实现思路

1、本申请实施例提供一种音频数据的处理方法、装置、电子设备及计算机可读存储介质、计算机程序产品,能够提升语音识别的准确性。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种音频数据的处理方法,所述方法包括:

4、获取待识别的音频数据;

5、对所述音频数据进行语音识别处理,得到候选识别结果;</p>

6、确定本文档来自技高网...

【技术保护点】

1.一种音频数据的处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述音频数据进行语音识别处理,得到候选识别结果,包括:

3.根据权利要求1所述的方法,其特征在于,

4.根据权利要求3所述的方法,其特征在于,所述候选识别结果是基于所述字符解码器的字符解码处理得到的;

5.根据权利要求3所述的方法,其特征在于,

6.根据权利要求3所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,

8.根据权利要求1所述的方法,其特征在于,所述确定所述候...

【技术特征摘要】

1.一种音频数据的处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述音频数据进行语音识别处理,得到候选识别结果,包括:

3.根据权利要求1所述的方法,其特征在于,

4.根据权利要求3所述的方法,其特征在于,所述候选识别结果是基于所述字符解码器的字符解码处理得到的;

5.根据权利要求3所述的方法,其特征在于,

6.根据权利要求3所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,

8.根据权利要求1所述的方法,其特征在于,所述确定所述候选识别结果在语料库中存在同近音字符的同近音概率,包括:

9.根据权利要求8所述的方法,其特征在于,所述对所述候选识别结果进行特征提取处理,得到文本特征,包括:

10.根据权利要求8所述的方法,其特征在于,所述对所述文本特征与所述音频数据的音频编码序列进行特征...

【专利技术属性】
技术研发人员:江勇军
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1