一种混合语音识别方法、系统、计算机设备和存储介质技术方案

技术编号:42432110 阅读:24 留言:0更新日期:2024-08-16 16:43
本发明专利技术公开了一种混合语音识别方法、系统、计算机设备和存储介质,包括根据第一单语种语音数据和第二单语种语音数据,建立第一单语种模型和第二单语种模型;将第一单语种语音数据和第二单语种语音数据进行拼接,得到混合语种数据,并根据混合语种数据,建立语种分类特征提取模型;将第一单语种模型、第二单语种模型和语种分类特征提取模型进行融合,得到混合语音识别模型;将待识别的混合语音数据输入混合语音识别模型,得到语音识别结果。本发明专利技术通过融合汉语、粤语单语种模型和语种分类特征提取模型的特征,构建了混合语音识别模型,能够自动识别输入语音的语种,并综合不同语种模型提供的特征进行识别,有效提高了语音识别的准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及语音识别,特别是涉及一种混合语音识别方法、系统、计算机设备和存储介质


技术介绍

1、语音识别技术自20世纪中期以来取得了显著的进展,成为了许多领域中的核心应用,包括自然语言处理、智能助手、语音控制系统、自动翻译等。然而,在多语种环境下,特别是像中国这样拥有多种方言的国家,传统的语音识别系统在多语种混合的语音输入中存在一系列挑战。

2、在我国,汉语(普通话)和粤语是两种最为广泛使用的语言之一,它们在不同的地区、文化和社会背景中得到广泛使用。然而,由于它们之间的差异,传统的语音识别系统在混合语音输入的情况下通常表现出较低的准确性。这主要是因为两种语言的音韵和语法结构存在明显的差异,导致传统的单一语言模型无法有效地处理混合语音。


技术实现思路

1、为了解决上述技术问题,本专利技术提供了一种混合语音识别方法、系统、计算机设备和存储介质,以能够解决单一语言模型无法有效地处理混合语音的问题,达到对汉粤混合语音准确高效的识别的技术效果。

2、第一方面,本专利技术实施例提供了一种混合语本文档来自技高网...

【技术保护点】

1.一种混合语音识别方法,其特征在于,包括:

2.根据权利要求1所述的混合语音识别方法,其特征在于,所述第一单语种模型和所述第二单语种模型均采用有监督训练,并采用连接主义时间分类损失作为损失函数;

3.根据权利要求1所述的混合语音识别方法,其特征在于,所述将第一单语种语音数据和第二单语种语音数据进行拼接,得到混合语种数据的步骤包括:

4.根据权利要求2所述的混合语音识别方法,其特征在于,所述并根据混合语种数据,建立语种分类特征提取模型的步骤包括:

5.根据权利要求4所述的混合语音识别方法,其特征在于,所述将第一单语种模型、第二单语种模型和语...

【技术特征摘要】

1.一种混合语音识别方法,其特征在于,包括:

2.根据权利要求1所述的混合语音识别方法,其特征在于,所述第一单语种模型和所述第二单语种模型均采用有监督训练,并采用连接主义时间分类损失作为损失函数;

3.根据权利要求1所述的混合语音识别方法,其特征在于,所述将第一单语种语音数据和第二单语种语音数据进行拼接,得到混合语种数据的步骤包括:

4.根据权利要求2所述的混合语音识别方法,其特征在于,所述并根据混合语种数据,建立语种分类特征提取模型的步骤包括:

5.根据权利要求4所述的混合语音识别方法,其特征在于,所述将第一单语种模型、第二单语种模型和语种分类特征提取模型进行融合,得到混合语音识别...

【专利技术属性】
技术研发人员:刘娟苏立伟康峰马喆非刘振华吴石松梁寿愚王帅余恒祥谭火超陈宋张立慧黄荣达吴海波伍广斌李紫京
申请(专利权)人:广东电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1