多语音识别模型切换方法及装置制造方法及图纸

技术编号:13743885 阅读:51 留言:0更新日期:2016-09-23 06:32
本发明专利技术实施例公开了一种多语音识别模型切换方法及装置,所述方法包括:获取用户输入语音中的至少一条语音信息;对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型。本发明专利技术实施例通过对获取的语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型,能够实现不同语言间的语音识别模型的自动切换,不仅提高语音识别模型切换效率,而且使语音识别更加智能化。

【技术实现步骤摘要】

本专利技术实施例涉及语音识别
,尤其涉及一种多语音识别模型切换方法及装置
技术介绍
随着科学技术的发展,语音输入技术由于其使用起来受场景的限制较少,且相对于手写输入更加快捷方便,因此逐渐得到普遍使用。例如,现有的搜索引擎都加入了语音搜索功能。目前虽然普通话已经成为了国人的主要交流语言,但是就局部地区而言,当地的方言的交流仍然有很大的需求。现有的语音识别引擎仅仅支持特定的语言,对于该语言以外的语音识别性能基本无法使用,因此用户在使用前一般需要提前选定特定语言的语音识别引擎。然而一旦用户需要进行语言切换,则需要进入语音识别引擎设置界面,手动切换成使用的方言,才能进行语音识别。显然,这种语言切换方式效率比较低下,不够智能化。
技术实现思路
本专利技术实施例提供一种多语音识别模型切换方法及装置,以实现不同语言间的语音识别模型的自动切换,提高语音识别模型切换效率,使语音识别更加智能化。第一方面,本专利技术实施例提供了一种多语音识别模型切换方法,包括:获取用户输入语音中的至少一条语音信息;对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型。第二方面,本专利技术实施例还提供了一种多语音识别切换装置,包括:语音获取模块,用于获取用户输入语音中的至少一条语音信息;语言识别模块,用于对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;模型切换模块,用于将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型。本专利技术实施例通过对获取的语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型,能够实现不同语言间的语音识别模型的自动切换,不仅提高语音识别模型切换效率,而且使语音识别更加智能化。附图说明图1是本专利技术实施例一中的一种多语音识别模型切换方法的流程图;图2是本专利技术实施例二中的一种多语音识别模型切换方法的流程图;图3是本专利技术实施例三中的一种多语音识别模型切换方法的流程图;图4是本专利技术实施例四中的一种多语音识别模型切换方法的流程图;图5是本专利技术实施例五中的一种多语音识别切换装置的结构图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种多语音识别模型切换方法的流程图,本实施例可适用于在多个语音识别模型下进行切换的情况,该方法可以由本专利技术实施例提供的多语音识别切换装置来执行,该装置可集成于移动终端、固定终端或服务器中,如图1所示,具体包括:S101、获取用户输入语音中的至少一条语音信息。其中,所述语音信息可以为截取的输入语音中的部分语音信息,也可以为用户一条完整的语音信息。所述语音信息中可包含一条或多条语音语句。具体的,可通过终端的麦克风来采集语音。例如,在语音输入界面提供语音输入按钮,当用户启动该按钮时,即可采集用户的语音信息。S102、对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别。其中,所述语言类别包含但不限于语种类别和方言类别。其中,所述语种类别包含各国的语种,例如包括汉语、英语、俄语、法语、德语等等,所述方言类别包含但不限于各国的方言,以中国为例,例如包括山东方言、东北方言、北京方言、陕西方言、广东方言等等。具体的,可预先采集用户使用各语言类别输入的语音信息,通过分类算法
训练得到语音识别模型,所述语音识别模型中包含各语言类别输入的语音。在使用语音识别模型对待分类的语音信息进行识别时,再次采用分类算法对待分类的语音信息进行分类处理,如果该待分类的语音信息被归类到山东方言,则将山东方言作为与该语音信息匹配的方言。S103、将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型。当确定了与所述语音信息匹配的目标语言类别之后,则将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型,使用该对应的语音识别模型对用户后续的语音输入进行识别。当与所述语音信息匹配的目标语言类别有多个时,例如除了被归类到山东方言之外,还被归类到了河南方言,此时根据匹配度确定目标语言类别,例如,将与所述语音信息匹配度最高的语言类别作为目标语言类别。或者,将与所述匹配度超过预设阈值的语言类别作为目标语言类别。本实施例通过对获取的语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型,能够实现不同语言间的语音识别模型的自动切换,不仅提高语音识别模型切换效率,而且使语音识别更加智能化。在上述实施例的基础上,对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别,包括:对所述语音信息基于至少两种语言类别的特征进行识别,并得到所述语音信息与各个语言类别的相似程度,将所述相似程度作为语言类别的匹配度。其中,可通过以下任意一种方法获得所述语音信息与各个语言类别的相似程度:对所述语音信息基于至少两种为各语言类别的特征进行识别并得到所述语音信息为各语言类别的置信度,将置信度作为语言类别的相似度;或对所述语音信息基于至少两种为各语言类别的特征进行识别并得到所述语音信息为各语言类别语言得分,将语音得分作为语言类别的相似度;或对所述语音信息基于至少两种为各语言类别的特征进行识别并得到所述语音信息为各语言类别的概率,将概率作为语言类别的相似度。其中,所述语言得分可采用的现有的语音测试模型打分得到,所述概率可根据语言得分采用概率转换公式转换得到,所述置信度为概率区间。在上述实施例的基础上,当仅根据一条语音语句不能足以判断出对应的目标语言类别时,为进一步提高识别准确率,对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别,包括:对所述语音信息包含的至少两条语音语句进行识别,得到各条语音语句与语言类别的匹配度;根据所述匹配度确定初始语言类别,根据各条语音语句与初始语言类别的匹配度确定对应的目标语言类别。其中,所述至少两条语音语句按照时序依次获取,如果根据第一条语音语句不能判断出对应的目标语言类别,则获取第二条语音语句,依次类推,直至能够判处对应的目标语言类别为止。如果根据第一条语音语句能够判断出对应的目标语言类别,则无需获取第二条语音语句。具体的,首先获取第一条语音语句,通过对所述第一条语音语句进行识别,得到第一条语音语句与语言类别的匹配度,如果该匹配度超过预设匹配度,则
将该第一条语音语句对应的语言类别作为目标语言类别。如果该匹配度未超过预设匹配度,则提示用户是否手动切换语音识别模型,和/或,获取第二条语音语句,通过对所述第二条语音语句进行识别,得到第二条语音语句与语言类别的匹配度,依次类推,直至得到满足预设条件的目标语言类别。另外,一条语音语句可能对应多个语言类别,如下表一所示,可根据该条语音语句相对于各个语言类别的匹配度,将匹配最高的语言类别作为初始语言类别。例如,如表一所示,由于山东方言相对于河本文档来自技高网
...

【技术保护点】
一种多语音识别模型切换方法,其特征在于,包括:获取用户输入语音中的至少一条语音信息;对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型。

【技术特征摘要】
1.一种多语音识别模型切换方法,其特征在于,包括:获取用户输入语音中的至少一条语音信息;对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型。2.根据权利要求1所述的方法,其特征在于,对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别,包括:对所述语音信息基于至少两种语言类别的特征进行识别,并得到所述语音信息与各个语言类别的相似程度,将所述相似程度作为语言类别的匹配度。3.根据权利要求1所述的方法,其特征在于,对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别,包括:对所述语音信息包含的至少两条语音语句进行识别,得到各条语音语句与语言类别的匹配度;根据所述匹配度确定初始语言类别,根据各条语音语句与初始语言类别的匹配度确定对应的目标语言类别。4.根据权利要求3所述的方法,其特征在于,根据各条语音语句与初始语言类别的匹配度确定对应的目标语言类别,包括:计算将各条语音语句不是初始语言类别的概率的乘积,根据所述乘积确定对应的目标语言类别。5.根据权利要求1~4任一项所述的方法,其特征在于,对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别之前,还包括:对所述语音信息进行以下任意一项预处理:语音特征提取、有效语音检测、语音矢量表示和模型打分测试。6.根据权利要求1~4任一项所述的方法,其特征在于,还包括:对所述语音信息进行识别,若识别结果不符合预设条件,则显示提示消息,以提示用户进行手动切换。7.根据权利要求1~4任一项所述的方法,其特征在于,对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别,包括:对所述语音信息进行识别和语言类别的匹配;确定匹配度符合预设条件的至少两种备选语言类别;查询用户历史语音识别记录确定用户历史使用的语言类别;从至少两个所述备选语言类别中选取与用户历史使用的语言类别一致的...

【专利技术属性】
技术研发人员:蒋兵李先刚丁科
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1