语音识别方法和装置制造方法及图纸

技术编号:14992327 阅读:40 留言:0更新日期:2017-04-03 23:07
本发明专利技术提出一种语音识别方法和装置,该语音识别方法包括:接收待识别的语音信号;确定所述语音信号属于的领域;后台切换为所述领域对应的语音识别模型,并采用所述语音识别模型对所述语音信号进行语音识别。该方法能够提高语音识别的准确度。

【技术实现步骤摘要】

本专利技术涉及语音识别
,尤其涉及一种语音识别方法和装置
技术介绍
语音识别可以将语音识别为文字。在语音识别时,通常是根据语音识别模型对输入的语音信号进行识别,得到识别结果。相关技术中,会针对每个产品需求建立对应的识别后台,由于每个产品可能涉及多个领域,因此每个识别后台里面包含了多个模型,每次待识别的语音信号由这多个模型共同处理最后决定结果。但是,这种方式多余的模型可能会造成干扰,例如,无法有效区分“北京”或“背景”。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种语音识别方法,该方法可以提高语音识别的准确度。本专利技术的另一个目的在于提出一种语音识别装置。为达到上述目的,本专利技术第一方面实施例提出的语音识别方法,包括:接收待识别的语音信号;确定所述语音信号属于的领域;后台切换为所述领域对应的语音识别模型,并采用所述语音识别模型对所述语音信号进行语音识别。本专利技术第一方面实施例提出的语音识别方法,通过确定待识别的语音信号属于的领域,并采用对应领域的语音识别模型对语音信号进行语音识别,可以在语音信号属于不同领域时,动态切换采用的语音识别模型,相对于固定的语音识别模型的方式,可以提高精准性,从而提高语音识别的准确度。为达到上述目的,本专利技术第二方面实施例提出的语音识别装置,包括:接收模块,用于接收待识别的语音信号;确定模块,用于确定所述语音信号属于的领域;第一识别模块,用于将后台切换为所述领域对应的语音识别模型,并采用所述语音识别模型对所述语音信号进行语音识别。本专利技术第二方面实施例提出的语音识别装置,通过确定待识别的语音信号属于的领域,并采用对应领域的语音识别模型对语音信号进行语音识别,可以在语音信号属于不同领域时,动态切换采用的语音识别模型,相对于固定的语音识别模型的方式,可以提高精准性,从而提高语音识别的准确度。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的语音识别方法的流程示意图;图2是本专利技术另一实施例提出的语音识别方法的流程示意图;图3是本专利技术另一实施例提出的语音识别方法的流程示意图;图4是本专利技术实施例中训练阶段及识别阶段的示意图;图5是本专利技术另一实施例提出的语音识别方法的流程示意图;图6是本专利技术另一实施例提出的语音识别装置的结构示意图;图7是本专利技术另一实施例提出的语音识别装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本专利技术一实施例提出的语音识别方法的流程示意图,该方法包括:S11:接收待识别的语音信号。用户在使用应用程序(APP)时,可以通过APP提供的语音识别功能输入待识别的语音信号。S12:确定所述语音信号属于的领域。一些实施例中,参见图2,S11可以包括:S111:向用户询问当前交互阶段的信息。APP可以以文字或语音等方式将询问信息通知给用户。S112:接收用户语音输入的回复信息,将所述回复信息确定为所述待识别的语音信号。相应的,S12可以包括:S121:根据所述当前交互阶段的信息属于的领域,确定为所述语音信号属于的领域。APP可以与用户进行语音交互,向用户询问信息,例如,用户在预定酒店时,可以先向用户询问酒店类型、在用户回复后,再询问日期、城市、地点等信息,根据询问的信息属于的领域确定语音信号属于的领域,例如,当前询问的是酒店类型,待识别的语音信号是针对酒店类型的回复信息,则可以确定待识别的语音信号属于的领域是酒店类型。APP的领域可以预先设置,不同APP的领域可以相同或不同。S13:后台切换为所述领域对应的语音识别模型,并采用所述语音识别模型对所述语音信号进行语音识别。其中,可以预先生成一个或多个领域的语音识别模型,并建立领域与语音识别模型的对应关系,从而根据该对应关系,可以在识别后台切换到与当前的语音信号属于的领域对应的语音识别模型。在切换到对应领域的语音识别模型后,采用对应领域的语音识别模型对待识别的语音信号进行语音识别。例如,确定待识别的语音信号属于的领域是酒店类型时,则可以根据酒店类型对应的语音识别模型进行语音识别。一些实施例中,参见图3,该方法还可以包括:S14:收集不同领域的语料。例如,参见图4,对应一个APP,假设该APP的领域可以分为第一类、第二类、第三类等,则可以分别收集第一类的语料、第二类的语料、第三类的语料等。具体的,例如,对应酒店预订的APP,可以将领域分为酒店类型、日期、城市、地点等,则可以分别收集酒店类型的语料、日期的语料、城市的语料、地点的语料等。S15:根据不同领域的语料进行训练,生成对应领域的语音识别模型。例如,参见图4,根据第一类的语料生成第一类的语音识别模型等。S16:建立领域与语音识别模型的对应关系,以根据所述对应关系获取不同领域的语音识别模型。例如,第一类的语音识别模型称为第一模型,则可以建立第一类与第一模型的对应关系,从而接收到第一类的语音信号后,确定对应的语音识别模型是第一模型。在确定出语音信号对应的语音识别模型后,可以采用对应的语音识别模型对语音信号进行语音识别。例如,参见图4,采用第一类的语音识别模型对第一类的语音信号进行语音识别等。一些实施例中,参见图5,该方法还可以包括:S17:采用通用语音识别模型对所述语音信号进行语音识别,得到第二语音识别结果。S18:从第一语音识别结果和所述第二语音识别结果中选择最优的语音识别结果,将所述最优的语音识别结果作为最终的语音识别结果,其中,第一语音识别结果是采用所述语音信号属于的领域对应的语音识别模型对所述语音信号进行语音识别后得到。例如,参见图4,在语音识别时,可以不仅采用对应领域的语音识别模型对待识别的语音信号进行语音识别,还可以采用本文档来自技高网...

【技术保护点】
一种语音识别方法,其特征在于,包括:接收待识别的语音信号;确定所述语音信号属于的领域;后台切换为所述领域对应的语音识别模型,并采用所述语音识别模型对所述语音信号进行语音识别。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
接收待识别的语音信号;
确定所述语音信号属于的领域;
后台切换为所述领域对应的语音识别模型,并采用所述语音识别模型对所
述语音信号进行语音识别。
2.根据权利要求1所述的方法,其特征在于,所述接收待识别的语音信
号,包括:
向用户询问当前交互阶段的信息;
接收用户语音输入的回复信息,将所述回复信息确定为所述待识别的语音
信号。
3.根据权利要求2所述的方法,其特征在于,所述确定所述语音信号属
于的领域,包括:
根据所述当前交互阶段的信息属于的领域,确定为所述语音信号属于的领
域。
4.根据权利要求1所述的方法,其特征在于,还包括:
收集不同领域的语料;
根据不同领域的语料进行训练,生成对应领域的语音识别模型;
建立领域与语音识别模型的对应关系,以根据所述对应关系获取不同领域
的语音识别模型。
5.根据权利要求1所述的方法,其特征在于,在采用所述语音识别模型
对所述语音信号进行语音识别后得到第一语音识别结果,所述方法还包括:
采用通用语音识别模型对所述语音信号进行语音识别,得到第二语音识别
结果;
从所述第一语音识别结果和所述第二语音识别结果中选择最优的语音识
别结果,将所述最优的语音识别结果作为最终的语音识别结果进行输出。
6.根据权利要求1所述的方法,其特征在于,所述语音信号属于的领域
是一...

【专利技术属性】
技术研发人员:程强蒋正翔万广鲁
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1