【技术实现步骤摘要】
本公开涉及智能座舱,尤其涉及一种音频编码器训练方法、语音识别方法、装置、电子设备及存储介质。
技术介绍
1、在基于ai或人工智能的语音识别领域,大型语言模型(llm,large languagemodel)的应用正逐渐展现出巨大的潜力。然而,当前的语音识别技术仍然面临诸多挑战,尤其是在训练数据的质量和数量方面。高质量的训练数据是构建高准确性语音识别模型的关键,但现实中获取这样的数据往往受到多种限制。
2、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供一种音频编码器训练方法、语音识别方法、装置、电子设备及存储介质。
2、根据本公开实施例的第一方面,提供一种音频编码器训练方法,包括:将训练数据分别输入第一训练模型和第二训练模型;所述第一训练模型和第二训练模型具有关联关系;所述训练数据中包括:音频数据和文本数据;通过所述第一训练
...【技术保护点】
1.一种音频编码器训练方法,其特征在于,包括:
2.根据权利要求1所述的音频编码器训练方法,其特征在于,所述通过所述第二训练模型对所述训练数据进行特征提取,得到第二特征表示,包括:
3.根据权利要求2所述的音频编码器训练方法,其特征在于,所述第二特征表示,包括:第二音频特征表示,第二文本特征表示。
4.根据权利要求2所述的音频编码器训练方法,其特征在于,所述将所述音频特征序列和文本特征序列输入共享层,通过所述共享层进行上下文建模,确定所述第二特征表示,包括:
5.根据权利要求1所述的音频编码器训练方法,其特征在于,所述方
<...【技术特征摘要】
1.一种音频编码器训练方法,其特征在于,包括:
2.根据权利要求1所述的音频编码器训练方法,其特征在于,所述通过所述第二训练模型对所述训练数据进行特征提取,得到第二特征表示,包括:
3.根据权利要求2所述的音频编码器训练方法,其特征在于,所述第二特征表示,包括:第二音频特征表示,第二文本特征表示。
4.根据权利要求2所述的音频编码器训练方法,其特征在于,所述将所述音频特征序列和文本特征序列输入共享层,通过所述共享层进行上下文建模,确定所述第二特征表示,包括:
5.根据权利要求1所述的音频编码器训练方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的音频编码器训练方法,其特征在于,基于所述第二训练模型通过参数优化迁移,得到所述第一训练模型,包括:
7.根据权利要求1所述的音频编码器训练方法,其特征在于,将训练数据分别输入第一训练模型和第二训练模型,包括:
8.根据权利要求1或7所述的音频编码器训练方法,其特征在于,所述第一特征表示,包括:第一音频特征表示和第一文本特征表示;所述第二特征表示,包括:第二音频特...
【专利技术属性】
技术研发人员:苏航,孔玉祥,范利春,
申请(专利权)人:小米汽车科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。