一种语音识别方法及装置制造方法及图纸

技术编号：26422433 阅读：32 留言：0更新日期：2020-11-20 14:18

本申请公开了一种语音识别方法及装置；本申请与人工智能的语音技术和自然语言处理领域相关，本申请可以获取待识别的目标语音；基于预设声学模型和预设语言模型，对目标语音进行识别，得到至少一个初始识别文本及其识别概率，初始识别文本包括第一语种文本和第二语种文本；将每一初始识别文本中的第一语种文本转化为第三语种文本，以得到每一初始识别文本对应的目标候选识别文本，第三语种文本与第二语种文本属于相同语种的文本；对每一目标候选识别文本进行识别，得到每一目标候选识别文本的文本概率；基于每一候选识别文本的文本概率及其对应的初始识别文本的识别概率，确定目标语音的目标识别文本。本申请可以有效提升语音识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法及装置
本申请涉及人工智能领域，具体涉及一种语音识别方法及装置。
技术介绍
随着人工智能技术的发展，语音识别技术日趋成熟，基于语音识别技术可以在办公、家居、翻译等多个领域方便人们的工作生活，在一些场景下，语音识别需要面对混合语种的语音(如中英文混合的语音)，并对其进行识别，现有技术会搭建并训练一个神经网络模型来实现对混合语种的语音的识别。在对现有技术的研究和实践过程中，本申请的专利技术人发现，在训练神经网络模型的过程中需要海量的中英文样本语音，但实际上难以获得与需求数量一致的中英文样本语音，进而导致训练后的神经网络模型的识别准确率并不高。
技术实现思路
本申请实施例提供一种语音识别方法及装置，可以有效提升语音识别的准确率。本申请实施例提供一种语音识别方法，包括：获取待识别的目标语音；基于预设声学模型和预设语言模型，对所述目标语音进行识别，得到至少一个初始识别文本、以及每一初始识别文本的识别概率，其中，初始识别文本包括第一语种文本和第二语种文本；将每一...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：/n获取待识别的目标语音；/n基于预设声学模型和预设语言模型，对所述目标语音进行识别，得到至少一个初始识别文本、以及每一初始识别文本的识别概率，其中，初始识别文本包括第一语种文本和第二语种文本；/n将每一初始识别文本中的第一语种文本转化为第三语种文本，以得到每一初始识别文本对应的目标候选识别文本，所述第三语种文本与所述第二语种文本属于相同语种的文本；/n对每一目标候选识别文本进行识别，得到每一目标候选识别文本的文本概率，所述文本概率表征目标候选识别文本为与所述目标语音的标准识别文本语义相同的概率；/n基于每一目标候选识别文本的文本概率及其对应的初始识别文...

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
获取待识别的目标语音；
基于预设声学模型和预设语言模型，对所述目标语音进行识别，得到至少一个初始识别文本、以及每一初始识别文本的识别概率，其中，初始识别文本包括第一语种文本和第二语种文本；
将每一初始识别文本中的第一语种文本转化为第三语种文本，以得到每一初始识别文本对应的目标候选识别文本，所述第三语种文本与所述第二语种文本属于相同语种的文本；
对每一目标候选识别文本进行识别，得到每一目标候选识别文本的文本概率，所述文本概率表征目标候选识别文本为与所述目标语音的标准识别文本语义相同的概率；
基于每一目标候选识别文本的文本概率及其对应的初始识别文本的识别概率，从所有目标候选识别文本中确定所述目标语音的目标识别文本。

2.根据权利要求1所述的方法，所述将每一初始识别文本中的第一语种文本转化为第三语种文本，以得到每一初始识别文本对应的目标候选识别文本，所述第三语种文本与所述第二语种文本属于相同语种的文本，包括：
将初始识别文本中的第一语种文本转化为第三语种文本，得到至少一个候选识别文本；
从所述初始识别文本的至少一个候选识别文本中，确定所述初始识别文本对应的目标候选识别文本。

3.根据权利要求2所述的方法，所述从所述初始识别文本的至少一个候选识别文本中，确定所述初始识别文本对应的目标候选识别文本，包括：
对所述初始识别文本的至少一个候选识别文本进行识别，得到每一候选识别文本的语句概率，所述语句概率表征候选识别文本为预设逻辑语句的概率；
通过每一候选识别文本的语句概率，从至少一个候选识别文本中确定所述初始识别文本对应的目标候选识别文本。

4.根据权利要求2所述的方法，所述将初始识别文本中的第一语种文本转化为第三语种文本，得到至少一个候选识别文本，包括：
从目标词集中确定与初始识别文本中的第一语种文本语义相同的至少一个候选第三语种文本；
将所述初始识别文本中的第一语种文本替换为候选第三语种文本，以得到至少一个候选识别文本。

5.根据权利要求4所述的方法，所述方法还包括：
获取多个第二语种样本文本；
通过预设翻译模型，将每一第二语种样本文本转化为其对应的第一语种同义文本；
基于所有第二语种样本文本及其对应的第一语种同义文本，生成目标词集。

6.根据权利要求5所述的方法，所...

【专利技术属性】
技术研发人员：曹立新，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人