语音识别的唤醒词选择方法及装置制造方法及图纸

技术编号:15642607 阅读:183 留言:0更新日期:2017-06-16 16:07
本发明专利技术是关于一种语音识别的唤醒词选择方法及装置,其中,方法包括:获取多个候选唤醒词;根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。通过该技术方案,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。

【技术实现步骤摘要】
语音识别的唤醒词选择方法及装置
本专利技术涉及语音识别
,尤其涉及一种语音识别的唤醒词选择方法及装置。
技术介绍
目前,相关技术中可以通过语音对设备进行控制,设备不是实时录音并识别语音命令的,而是先识别是否收到唤醒词,如果收到唤醒词则激活,然后识别语音命令。唤醒效果的好坏依赖唤醒词的选择,唤醒词应具有较高的可区分性,从而能提高与非唤醒词语音以及环境音之间区分的正确性。
技术实现思路
本专利技术实施例提供一种语音识别的唤醒词选择方法及装置,用以选择可区分性高的唤醒词,从而提高唤醒词与非唤醒词以及环境音之间区分的正确性。根据本专利技术实施例的第一方面,提供一种语音识别的唤醒词选择方法,包括:获取多个候选唤醒词;根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。在一个实施例中,所述根据每个候选唤醒词的发音,计算出所述每个候选唤醒词对应的可区分性得分,包括:将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。在该实施例中,可以通过唤醒词发音来判断其可区分性,进而选择目标唤醒词,从而提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。在一个实施例中,所述根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分,包括:从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。discriP(wuw)表示唤醒词wuw的区分性,其值越大代表该唤醒词的区分性越好。在一个实施例中,所述根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词,包括:将可区分性得分最高的候选唤醒词确定为目标唤醒词。在该实施例中,在选择唤醒词时,根据每个候选唤醒词的发音计算每个候选唤醒词的可区分性得分,并从中选择可区分性得分最高的唤醒词为目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。在一个实施例中,所述方法还包括:接收用户输入的语音信息;对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;将所述可信程度分数与预设的阈值分数进行比较;当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。在该实施例中,如果用户输入的语音信息对应的文字信息的可信程度分数大于所述预设的阈值分数,则可以开启终端设备的语音识别功能,从而开始识别语音命令。根据本专利技术实施例的第二方面,提供一种语音识别的唤醒词选择装置,包括:获取模块,用于获取多个候选唤醒词;计算模块,用于根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;确定模块,用于根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。在一个实施例中,所述计算模块包括:分解子模块,用于将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;计算子模块,用于根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。在一个实施例中,所述计算子模块用于:从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。在一个实施例中,所述确定模块用于:将可区分性得分最高的候选唤醒词确定为目标唤醒词。在一个实施例中,所述装置还包括:接收模块,用于接收用户输入的语音信息;识别模块,用于对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;对比模块,用于将所述可信程度分数与预设的阈值分数进行比较;处理模块,用于当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的一种语音识别的唤醒词选择方法的流程图。图2是根据一示例性实施例示出的一种语音识别的唤醒词选择方法中步骤S102的流程图。图3是根据一示例性实施例示出的又一种语音识别的唤醒词选择方法的流程图。图4是根据一示例性实施例示出的另一种语音识别的唤醒词选择方法的流程图。图5是根据一示例性实施例示出的一种语音识别的唤醒词选择装置的框图。图6是根据一示例性实施例示出的一种语音识别的唤醒词选择装置中计算模块的框图。图7是根据一示例性实施例示出的另一种语音识别的唤醒词选择装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种语音识别的唤醒词选择方法的流程图。该一种语音识别的唤醒词选择方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音控制功能的设备。如图1所示,该方法包括步骤S101-S103:在步骤S101中,获取多个候选唤醒词;在步骤S102中,根据每个候选唤醒词对应的发音,计算出每个候选唤醒词对应的可区分性得分;在步骤S103中,根据每个候选唤醒词对应的可区分性得分确定目标唤醒词。在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非本文档来自技高网...
语音识别的唤醒词选择方法及装置

【技术保护点】
一种语音识别的唤醒词选择方法,用于终端设备,其特征在于,包括:获取多个候选唤醒词;根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。

【技术特征摘要】
1.一种语音识别的唤醒词选择方法,用于终端设备,其特征在于,包括:获取多个候选唤醒词;根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。2.根据权利要求1所述的方法,其特征在于,所述根据每个候选唤醒词的发音,计算出所述每个候选唤醒词对应的可区分性得分,包括:将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。3.根据权利要求2所述的方法,其特征在于,所述根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分,包括:从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。4.根据权利要求1所述的方法,其特征在于,所述根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词,包括:将可区分性得分最高的候选唤醒词确定为目标唤醒词。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:接收用户输入的语音信息;对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;将所述可信程度分数与预设的阈值分数进行比较;当所述可信程度分数大于所述预设的阈值分数时,开启...

【专利技术属性】
技术研发人员:朱辉王明明闫子魁
申请(专利权)人:北京云知声信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1