【技术实现步骤摘要】
一种语音识别方法及装置
本申请涉及人工智能领域,具体涉及一种语音识别方法及装置。
技术介绍
随着人工智能技术的发展,语音识别技术日趋成熟,基于语音识别技术可以在办公、家居、翻译等多个领域方便人们的工作生活,在一些场景下,语音识别需要面对混合语种的语音(如中英文混合的语音),并对其进行识别,现有技术会搭建并训练一个神经网络模型来实现对混合语种的语音的识别。在对现有技术的研究和实践过程中,本申请的专利技术人发现,在训练神经网络模型的过程中需要海量的中英文样本语音,但实际上难以获得与需求数量一致的中英文样本语音,进而导致训练后的神经网络模型的识别准确率并不高。
技术实现思路
本申请实施例提供一种语音识别方法及装置,可以有效提升语音识别的准确率。本申请实施例提供一种语音识别方法,包括:获取待识别的目标语音;基于预设声学模型和预设语言模型,对所述目标语音进行识别,得到至少一个初始识别文本、以及每一初始识别文本的识别概率,其中,初始识别文本包括第一语种文本和第二语种文本;将每一 ...
【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n获取待识别的目标语音;/n基于预设声学模型和预设语言模型,对所述目标语音进行识别,得到至少一个初始识别文本、以及每一初始识别文本的识别概率,其中,初始识别文本包括第一语种文本和第二语种文本;/n将每一初始识别文本中的第一语种文本转化为第三语种文本,以得到每一初始识别文本对应的目标候选识别文本,所述第三语种文本与所述第二语种文本属于相同语种的文本;/n对每一目标候选识别文本进行识别,得到每一目标候选识别文本的文本概率,所述文本概率表征目标候选识别文本为与所述目标语音的标准识别文本语义相同的概率;/n基于每一目标候选识别文本的文本概率 ...
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
获取待识别的目标语音;
基于预设声学模型和预设语言模型,对所述目标语音进行识别,得到至少一个初始识别文本、以及每一初始识别文本的识别概率,其中,初始识别文本包括第一语种文本和第二语种文本;
将每一初始识别文本中的第一语种文本转化为第三语种文本,以得到每一初始识别文本对应的目标候选识别文本,所述第三语种文本与所述第二语种文本属于相同语种的文本;
对每一目标候选识别文本进行识别,得到每一目标候选识别文本的文本概率,所述文本概率表征目标候选识别文本为与所述目标语音的标准识别文本语义相同的概率;
基于每一目标候选识别文本的文本概率及其对应的初始识别文本的识别概率,从所有目标候选识别文本中确定所述目标语音的目标识别文本。
2.根据权利要求1所述的方法,所述将每一初始识别文本中的第一语种文本转化为第三语种文本,以得到每一初始识别文本对应的目标候选识别文本,所述第三语种文本与所述第二语种文本属于相同语种的文本,包括:
将初始识别文本中的第一语种文本转化为第三语种文本,得到至少一个候选识别文本;
从所述初始识别文本的至少一个候选识别文本中,确定所述初始识别文本对应的目标候选识别文本。
3.根据权利要求2所述的方法,所述从所述初始识别文本的至少一个候选识别文本中,确定所述初始识别文本对应的目标候选识别文本,包括:
对所述初始识别文本的至少一个候选识别文本进行识别,得到每一候选识别文本的语句概率,所述语句概率表征候选识别文本为预设逻辑语句的概率;
通过每一候选识别文本的语句概率,从至少一个候选识别文本中确定所述初始识别文本对应的目标候选识别文本。
4.根据权利要求2所述的方法,所述将初始识别文本中的第一语种文本转化为第三语种文本,得到至少一个候选识别文本,包括:
从目标词集中确定与初始识别文本中的第一语种文本语义相同的至少一个候选第三语种文本;
将所述初始识别文本中的第一语种文本替换为候选第三语种文本,以得到至少一个候选识别文本。
5.根据权利要求4所述的方法,所述方法还包括:
获取多个第二语种样本文本;
通过预设翻译模型,将每一第二语种样本文本转化为其对应的第一语种同义文本;
基于所有第二语种样本文本及其对应的第一语种同义文本,生成目标词集。
6.根据权利要求5所述的方法,所...
【专利技术属性】
技术研发人员:曹立新,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。