一种语音识别方法、装置及存储介质制造方法及图纸

技术编号:23346404 阅读:24 留言:0更新日期:2020-02-15 04:54
本申请实施例公开了一种语音识别方法、装置及存储介质,包括:提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;根据所述第一得分和所述第二得分,确定最终识别结果。采用本申请实施例,提高了语音识别的准确性和效率。

A speech recognition method, device and storage medium

【技术实现步骤摘要】
一种语音识别方法、装置及存储介质
本申请涉及人工智能
,尤其涉及一种语音识别方法、装置及存储介质。
技术介绍
语音技术(SpeechTechnology)的关键技术有自动语音识别技术(AutomaticSpeechRecognition,ASR)和语音合成技术(TextToSpeech,TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。可以采用以下几种方式进行语音识别:第一,将各个领域相关的语料训练和通用语料进行合并重新训练语言模型并重新合成解码图HCLG。第二,在基于端到端语音识别系统中添加领域相关的音频、文本在大规模的语料上进行重新训练相关模型。但是,在实际场景中,需要对整个模型进行重新训练部署,导致语音识别效率低。并且由于领域相关的语料并不会很多,识别的准确性较低。
技术实现思路
本申请实施例提供一种语音识别方法、装置及存储介质。可以提高语音识别的准确性和效率。第一方面,本申请实施例提供了一种语音识别方法,包括:提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;根据所述第一得分和所述第二得分,确定最终识别结果。其中,所述第一模型的词表包括特殊标识符,所述根据所述语言词汇所属的领域类型加载第二模型包括:确定所述语言词汇所属的领域类型对应的特殊标识符;根据所述特殊标识符,从预设的多个领域模型查找所述第二模型并进行加载。其中,所述第一模型包括第一常用语言模型和第一重打分语言模型,所述第一常用语言模型为根据二元语言模型生成的,所述第一重打分语言模型为根据五元语言模型生成的;所述提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分包括:根据所述第一常用语言模型对所述语音信号流进行识别得到多个所述第一识别结果,一个所述第一识别结果对应一个所述第一得分;根据所述第一重打分语言模型对多个所述第一识别结果进行排序,选择最高的所述第一得分对应的所述第一识别结果。其中,所述第二模型包括第二领域语言模型和第二重打分语言模型,所述第二领域语言模型为根据一元语言模型生成的;所述将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分包括:根据所述第二领域语言模型对所述语言词汇进行识别得到多个所述第二识别结果,一个所述第二识别结果对应一个所述第二得分;根据所述第二重打分语言模型对多个所述第二识别结果进行排序,选择最高的所述第二得分对应的所述第二识别结果。其中,所述根据所述第一得分和所述第二得分,确定最终识别结果包括:计算所述第一得分和所述第二得分的加权平均值;根据所述加权平均值,确定所述最终识别结果。其中,所述第二领域语言模型包括所述第一模型的待加强词汇;所述方法还包括:将所述第二模型识别出的针对所述待加强词汇的识别结果替换所述第一模型识别出的针对所述待加强词汇的识别结果,得到所述最终识别结果。第二方面,本申请实施例提供了一种语音识别装置,包括:处理模块,用于提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;所述处理模块,还用于当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;确定模块,用于根据所述第一得分和所述第二得分,确定最终识别结果。其中,所述处理模块,还用于确定所述语言词汇所属的领域类型对应的特殊标识符;根据所述特殊标识符,从预设的多个领域模型查找所述第二模型并进行加载。其中,所述第一模型包括第一常用语言模型和第一重打分语言模型,所述第一常用语言模型为根据二元语言模型生成的,所述第一重打分语言模型为根据五元语言模型生成的;所述处理模块,还用于根据所述第一常用语言模型对所述语音信号流进行识别得到多个所述第一识别结果,一个所述第一识别结果对应一个所述第一得分;根据所述第一重打分语言模型对多个所述第一识别结果进行排序,选择最高的所述第一得分对应的所述第一识别结果。其中,所述第二模型包括第二领域语言模型和第二重打分语言模型,所述第二领域语言模型为根据一元语言模型生成的;所述处理模块,还用于根据所述第二领域语言模型对所述语言词汇进行识别得到多个所述第二识别结果,一个所述第二识别结果对应一个所述第二得分;根据所述第二重打分语言模型对多个所述第二识别结果进行排序,选择最高的所述第二得分对应的所述第二识别结果。其中,所述确定模块,还用于计算所述第一得分和所述第二得分的加权平均值;根据所述加权平均值,确定所述最终识别结果。其中,所述第二领域语言模型包括所述第一模型的待加强词汇;所述处理模块,还用于将所述第二模型识别出的针对所述待加强词汇的识别结果替换所述第一模型识别出的针对所述待加强词汇的识别结果,得到所述最终识别结果。第三方面,本申请实施例提供了一种语音识别设备,包括:处理器、存储器和通信总线,其中,通信总线用于实现处理器和存储器之间连接通信,处理器执行存储器中存储的程序用于实现上述第一方面提供的一种语音识别方法中的步骤。在一个可能的设计中,本申请提供的语音识别设备可以包含用于执行上述方法中行为相对应的模块。模块可以是软件和/或硬件。本申请实施例的又一方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有多条指令,所述指令适于由处理器加载并执行上述各方面所述的方法。本申请实施例的又一方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。实施本申请实施例,提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;根据所述第一得分和所述第二得分,确定最终识别结果。通过动态加载领域模型,提高了语音识别的效率和准确性。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;/n当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;/n根据所述第一得分和所述第二得分,确定最终识别结果。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;
当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;
根据所述第一得分和所述第二得分,确定最终识别结果。


2.如权利要求1所述的方法,其特征在于,所述第一模型的词表包括特殊标识符,所述根据所述语言词汇所属的领域类型加载第二模型包括:
确定所述语言词汇所属的领域类型对应的特殊标识符;
根据所述特殊标识符,从预设的多个领域模型查找所述第二模型并进行加载。


3.如权利要求1所述的方法,其特征在于,所述第一模型包括第一常用语言模型和第一重打分语言模型,所述第一常用语言模型为根据二元语言模型生成的,所述第一重打分语言模型为根据五元语言模型生成的;
所述提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分包括:
根据所述第一常用语言模型对所述语音信号流进行识别得到多个所述第一识别结果,一个所述第一识别结果对应一个所述第一得分;
根据所述第一重打分语言模型对多个所述第一识别结果进行排序,选择最高的所述第一得分对应的所述第一识别结果。


4.如权利要求1所述的方法,其特征在于,所述第二模型包括第二领域语言模型和第二重打分语言模型,所述第二领域语言模型为根据一元语言模型生成的;
所述将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分包括:
根据所述第二领域语言模型对所述语言词汇进行识别得到多个所述第二识别结果,一个所述第二识别结果对应一个所述第二得分;
根...

【专利技术属性】
技术研发人员:康跃腾付彦喆王朋飞
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1