一种语音识别方法、装置及存储介质制造方法及图纸

技术编号:23346404 阅读:31 留言:0更新日期:2020-02-15 04:54
本申请实施例公开了一种语音识别方法、装置及存储介质,包括:提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;根据所述第一得分和所述第二得分,确定最终识别结果。采用本申请实施例,提高了语音识别的准确性和效率。

A speech recognition method, device and storage medium

【技术实现步骤摘要】
一种语音识别方法、装置及存储介质
本申请涉及人工智能
,尤其涉及一种语音识别方法、装置及存储介质。
技术介绍
语音技术(SpeechTechnology)的关键技术有自动语音识别技术(AutomaticSpeechRecognition,ASR)和语音合成技术(TextToSpeech,TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。可以采用以下几种方式进行语音识别:第一,将各个领域相关的语料训练和通用语料进行合并重新训练语言模型并重新合成解码图HCLG。第二,在基于端到端语音识别系统中添加领域相关的音频、文本在大规模的语料上进行重新训练相关模型。但是,在实际场景中,需要对整个模型进行重新训练部署,导致语音识别效率低。并且由于领域相关的语料并不会很多,识别的准确性较低。
技术实现思路
本申请实施例提供一种语音识别方法、装置及存储介质。可以提高语音识别的准确性和效率。第一方面,本申请实施例提供了一种语音识别方法,包括:提取语本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;/n当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;/n根据所述第一得分和所述第二得分,确定最终识别结果。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;
当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;
根据所述第一得分和所述第二得分,确定最终识别结果。


2.如权利要求1所述的方法,其特征在于,所述第一模型的词表包括特殊标识符,所述根据所述语言词汇所属的领域类型加载第二模型包括:
确定所述语言词汇所属的领域类型对应的特殊标识符;
根据所述特殊标识符,从预设的多个领域模型查找所述第二模型并进行加载。


3.如权利要求1所述的方法,其特征在于,所述第一模型包括第一常用语言模型和第一重打分语言模型,所述第一常用语言模型为根据二元语言模型生成的,所述第一重打分语言模型为根据五元语言模型生成的;
所述提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分包括:
根据所述第一常用语言模型对所述语音信号流进行识别得到多个所述第一识别结果,一个所述第一识别结果对应一个所述第一得分;
根据所述第一重打分语言模型对多个所述第一识别结果进行排序,选择最高的所述第一得分对应的所述第一识别结果。


4.如权利要求1所述的方法,其特征在于,所述第二模型包括第二领域语言模型和第二重打分语言模型,所述第二领域语言模型为根据一元语言模型生成的;
所述将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分包括:
根据所述第二领域语言模型对所述语言词汇进行识别得到多个所述第二识别结果,一个所述第二识别结果对应一个所述第二得分;
根...

【专利技术属性】
技术研发人员:康跃腾付彦喆王朋飞
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1