【技术实现步骤摘要】
一种音频识别方法、装置、存储介质及电子设备
[0001]本申请涉及信息处理
,更具体的说是涉及一种音频识别方法、装置、存储介质及电子设备。
技术介绍
[0002]随着音频处理技术的发展,音频识别对不同场景有不同的应用需求,如线上授课、会议等需要将其中的音频数据转换为文本信息进行记录,影视剧中需要将角色的音频信息转换为实时字幕等。通常音频识别的处理流程是设备端采集音频,对音频进行编码压缩后通过网络传输到服务平台进行识别并返回识别的文本结果。但是,设备端采集到的音频有多种形式,如包括人的语音、音乐及其他杂音,当对主要的音频进行识别时,由于其他音频的影响,降低了语音的识别效果以及精准性。
技术实现思路
[0003]有鉴于此,本申请提供如下技术方案:
[0004]一种音频识别方法,包括:
[0005]获取待识别音频数据;
[0006]对所述待识别音频数据进行分类检测,获得所述待识别音频数据对应的音频类型;
[0007]基于与每一音频类型对应的音频处理参数,对每一音频类型对应的音频 ...
【技术保护点】
【技术特征摘要】
1.一种音频识别方法,包括:获取待识别音频数据;对所述待识别音频数据进行分类检测,获得所述待识别音频数据对应的音频类型;基于与每一音频类型对应的音频处理参数,对每一音频类型对应的音频子数据进行处理,获得与每一音频子数据对应的音频子处理结果;基于每一所述音频子处理结果,对所述待识别音频数据进行识别,得到目标音频识别结果。2.根据权利要求1所述的方法,所述对所述待识别音频数据进行分类检测,获得所述待识别音频数据对应的音频类型,包括:提取所述待识别音频数据的音频特征;确定与每一所述音频特征相匹配的音频类型。3.根据权利要求2所述的方法,所述确定与每一所述音频特征相匹配的音频类型,包括:将所述音频特征输入至音频分类模型,输出得到与每一所述音频特征相匹配的音频类型;其中,所述音频分类模型为基于音频训练数据和深度神经网络训练得到的模型,所述音频类型至少包括目标对象的语音、音乐和环境杂音。4.根据权利要求1所述的方法,所述基于与每一音频类型对应的音频处理参数,对每一音频类型对应的音频子数据进行处理,获得与每一音频子数据对应的音频子处理结果,包括:基于所述待识别音频数据对应的音频类型,确定目标音频类型;确定与所述目标音频类型对应的目标音频处理参数;基于所述目标音频处理参数对与所述目标音频类型对应的音频子数据进行处理,得到第一音频子处理结果;基于初始音频处理参数对所述目标音频类型之外的音频类型的音频子数据进行处理,得到第二音频子处理结果。5.根据权利要求4所述的方法,所述确定与所述目标音频类型对应的目标音频处理参数,包括:获得所述目标音频类型对应的音频特征以及音频识别场景的网络特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。