一种粤汉跨方言语音识别方法、装置及介质制造方法及图纸

技术编号:42017997 阅读:13 留言:0更新日期:2024-07-16 23:11
本发明专利技术公开了一种粤汉跨方言语音识别方法、装置及介质,所述方法包括:获取目标语音数据;通过预设的粤汉跨方言语音识别模型对目标语音数据进行识别,得到识别结果;其中,粤汉跨方言语音识别模型是根据目标识别方向在统一音素集中对应的数据,对第一模型进行定向迁移而得到;第一模型是根据统一音素集,以语音识别任务作为主任务,以语音增强任务作为辅助任务,对预设的多方言模型进行训练而得到。本发明专利技术提出一种粤汉跨方言语音识别方法、装置及介质,通过使用粤汉跨方言语音识别模型对目标语音数据进行识别,即可得到识别结果,该识别方式能够大幅度减少数据处理时间,能够解决现有语音识别方法无法有效地理解和处理多种语言和口音的问题。

【技术实现步骤摘要】

本专利技术涉及计算机,特别是涉及一种粤汉跨方言语音识别方法、装置及介质


技术介绍

1、语音是人与人之间的交互方式,也是人机交互的重要入口,语音识别技术被应用于大众生活的方方面面,随着科学技术的发展,语音识别模型可以实现将语音转化为文本的功能,传统的智能语音系统对于单语言的语音识别已经取得一定的识别效果。目前,语音识别方法主要是通过模型进行识别,所使用的模型其语音识别性能主要是单一的,专注于单项任务的语音识别模型能有效避免指令调整过程中经常发生的负迁移问题。

2、然而,在多语言社会中,人们经常需要使用多种语言进行交流,因为传统的单一语音识别模型无法有效地理解和处理多种语言和口音,这使得现有方法无法准确地识别多种语音,导致现有语音识别方法在实际应用中受到了极大的限制。


技术实现思路

1、本专利技术提供一种粤汉跨方言语音识别方法、装置及介质,以解决现有语音识别方法无法有效地理解和处理多种语言和口音的问题。

2、为了解决上述问题,本专利技术提供了一种粤汉跨方言语音识别方法,包括:

...

【技术保护点】

1.一种粤汉跨方言语音识别方法,其特征在于,包括:

2.如权利要求1所述的一种粤汉跨方言语音识别方法,其特征在于,所述第一模型是根据所述统一音素集,以语音识别任务作为主任务,并以语音增强任务作为辅助任务,对预设的多方言模型进行训练而得到,具体为:

3.如权利要求1所述的一种粤汉跨方言语音识别方法,其特征在于,所述粤汉跨方言语音识别模型是根据预设的目标识别方向在统一音素集中对应的数据,对第一模型进行定向迁移而得到,具体为:

4.如权利要求1所述的一种粤汉跨方言语音识别方法,其特征在于,所述统一音素集是根据预先获取的粤语和汉语的语音数据建立而得,具体为:<...

【技术特征摘要】

1.一种粤汉跨方言语音识别方法,其特征在于,包括:

2.如权利要求1所述的一种粤汉跨方言语音识别方法,其特征在于,所述第一模型是根据所述统一音素集,以语音识别任务作为主任务,并以语音增强任务作为辅助任务,对预设的多方言模型进行训练而得到,具体为:

3.如权利要求1所述的一种粤汉跨方言语音识别方法,其特征在于,所述粤汉跨方言语音识别模型是根据预设的目标识别方向在统一音素集中对应的数据,对第一模型进行定向迁移而得到,具体为:

4.如权利要求1所述的一种粤汉跨方言语音识别方法,其特征在于,所述统一音素集是根据预先获取的粤语和汉语的语音数据建立而得,具体为:

5.如权利要求4所述的一种粤汉跨方言语音识别方法,其特征在于,获取粤语和汉语的语音数据,具体为:

6.如权利要求1所述的一种粤汉跨方言语音识别方法,其特征在于,所述综合损失函数具体为:

7.一种...

【专利技术属性】
技术研发人员:康峰苏立伟谭火超刘振华陈海燕杨晓东许睿李兰芳杨英勃曾晓锋简冬琳冼文祥李宗隽彭若馨李静李紫京
申请(专利权)人:广东电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1