一种混合语音识别方法、系统、计算机设备和存储介质技术方案

技术编号：42432110 阅读：24 留言：0更新日期：2024-08-16 16:43

本发明专利技术公开了一种混合语音识别方法、系统、计算机设备和存储介质，包括根据第一单语种语音数据和第二单语种语音数据，建立第一单语种模型和第二单语种模型；将第一单语种语音数据和第二单语种语音数据进行拼接，得到混合语种数据，并根据混合语种数据，建立语种分类特征提取模型；将第一单语种模型、第二单语种模型和语种分类特征提取模型进行融合，得到混合语音识别模型；将待识别的混合语音数据输入混合语音识别模型，得到语音识别结果。本发明专利技术通过融合汉语、粤语单语种模型和语种分类特征提取模型的特征，构建了混合语音识别模型，能够自动识别输入语音的语种，并综合不同语种模型提供的特征进行识别，有效提高了语音识别的准确性和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别，特别是涉及一种混合语音识别方法、系统、计算机设备和存储介质。

技术介绍

1、语音识别技术自20世纪中期以来取得了显著的进展，成为了许多领域中的核心应用，包括自然语言处理、智能助手、语音控制系统、自动翻译等。然而，在多语种环境下，特别是像中国这样拥有多种方言的国家，传统的语音识别系统在多语种混合的语音输入中存在一系列挑战。

2、在我国，汉语(普通话)和粤语是两种最为广泛使用的语言之一，它们在不同的地区、文化和社会背景中得到广泛使用。然而，由于它们之间的差异，传统的语音识别系统在混合语音输入的情况下通常表现出较低的准确性。这主要是因为两种语言的音韵和语法结构存在明显的差异，导致传统的单一语言模型无法有效地处理混合语音。

技术实现思路

1、为了解决上述技术问题，本专利技术提供了一种混合语音识别方法、系统、计算机设备和存储介质，以能够解决单一语言模型无法有效地处理混合语音的问题，达到对汉粤混合语音准确高效的识别的技术效果。

2、第一方面，本专利技术实...

【技术保护点】

1.一种混合语音识别方法，其特征在于，包括：

2.根据权利要求1所述的混合语音识别方法，其特征在于，所述第一单语种模型和所述第二单语种模型均采用有监督训练，并采用连接主义时间分类损失作为损失函数；

3.根据权利要求1所述的混合语音识别方法，其特征在于，所述将第一单语种语音数据和第二单语种语音数据进行拼接，得到混合语种数据的步骤包括：

4.根据权利要求2所述的混合语音识别方法，其特征在于，所述并根据混合语种数据，建立语种分类特征提取模型的步骤包括：

5.根据权利要求4所述的混合语音识别方法，其特征在于，所述将第一单语种模型、第二单语种模型和语...

【技术特征摘要】

1.一种混合语音识别方法，其特征在于，包括：

3.根据权利要求1所述的混合语音识别方法，其特征在于，所述将第一单语种语音数据和第二单语种语音数据进行拼接，得到混合语种数据的步骤包括：

4.根据权利要求2所述的混合语音识别方法，其特征在于，所述并根据混合语种数据，建立语种分类特征提取模型的步骤包括：

5.根据权利要求4所述的混合语音识别方法，其特征在于，所述将第一单语种模型、第二单语种模型和语种分类特征提取模型进行融合，得到混合语音识别...

【专利技术属性】
技术研发人员：刘娟，苏立伟，康峰，马喆非，刘振华，吴石松，梁寿愚，王帅，余恒祥，谭火超，陈宋，张立慧，黄荣达，吴海波，伍广斌，李紫京，
申请(专利权)人：广东电网有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人