【技术实现步骤摘要】
一种基于多声学模型的防误唤醒方法及语音识别模组
本专利技术属于语音识别
,具体涉及一种基于多声学模型的防误唤醒方法及语音识别模组。
技术介绍
随着日渐增多的人机交互需要,语音识别相关的应用在生活中越来越多。在逐渐成熟的语音交互中,人们开始更多的追求对语音识别的舒适感,追求语音识别的准确性。语音识别是通过语言模型和声学模型的匹配,从而达到识别。由于当下绝大部分的语音识别都是基于单个声学模型与单个语言模型的匹配识别,其会存在较大的误唤醒情况,例如在英文模型当中,由于只将部分英文语料在训练时标注成垃圾词,会导致在中文环境下,某些与英文命令词发音相近的中文词会被英文模型误识别为英文命令词,从而识别做出相应。而现有技术的解决办法为扩充训练英文声学模型所需的垃圾词库,这种方法可以解决英文模型在英文环境下的误唤醒情况,也可以给中文环境下的英文模型的误识别情况带来改善,但仍然不能有效的解决问题。
技术实现思路
为克服现有技术存在的技术缺陷,本专利技术公开了一种基于多声学模型的防误唤醒方法及语音识别模组。r>本专利技术所述基本文档来自技高网...
【技术保护点】
1.一种基于多声学模型的防误唤醒方法,其特征在于,包括如下步骤:/nS1.分别选取训练多个不同语言的声学模型所需的语言语料;其中在训练不同声学模型对应的语言语料中均应包含命令词语料;/nS2.对语料进行处理,其中命令词语料对应的命令词的发音在多个语言模型下的发音相同或相似;/nS3.利用处理后的语料分别对对应的声学模型进行训练;/nS4.将训练后的声学模型与语言模型打包形成不同语言的语音识别固件并烧录到语音识别模组中;/nS5.具体识别过程中,语音识别模组将待识别的音频同时输入多个语音识别固件,当多个语音识别固件同时识别出为命令词时,语音识别模组判定为命令词并执行命令;/n ...
【技术特征摘要】
1.一种基于多声学模型的防误唤醒方法,其特征在于,包括如下步骤:
S1.分别选取训练多个不同语言的声学模型所需的语言语料;其中在训练不同声学模型对应的语言语料中均应包含命令词语料;
S2.对语料进行处理,其中命令词语料对应的命令词的发音在多个语言模型下的发音相同或相似;
S3.利用处理后的语料分别对对应的声学模型进行训练;
S4.将训练后的声学模型与语言模型打包形成不同语言的语音识别固件并烧录到语音识别模组中;
S5.具体识别过程中,语音识别模组将待识别的音频同时输入多个语音识别固件,当多个语音识别固件同时识别出为命令词时,语音识别模组判定为命令词并执行命令;
未同时识别出为命令词,则认为不是命令词。
2.如权利要求1所述的基于多声学模型的防误唤醒方法,其特征在于
针对两种不同语言,具体包括如下步骤:
S11.分别选取训练第一、第二声学模型所需的语料;其中在训练不同声学模型对应的语言语料中均应包含命令词语料;
S21.对语料进行处理,其中命令词的发音在第一、第二语言模型下的发音相同或相似;
S31.利用处理后的两种语言语料分别对第一声学模型和第二声学模型进行训练;
S41.将训练后的声学模型与语言模型...
【专利技术属性】
技术研发人员:舒畅,何云鹏,许兵,
申请(专利权)人:成都启英泰伦科技有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。