【技术实现步骤摘要】
语音处理方法和语音处理装置
本专利技术涉及电子
,特别是涉及到一种语音处理方法和语音处理装置。
技术介绍
语音唤醒技术是人工智能的一个分支,语音唤醒技术的应用领域很广泛,比如可以应用于机器人、手机、可穿戴设备、智能家居、车载等领域。许多带有语音识别功能的设备都会利用语音唤醒技术作为人与机器互动的开始。语音唤醒是指用户说出特定的语音指令时,设备从休眠状态切换到工作状态,并给出指定响应。唤醒技术的用途在于,用户对于设备的操作可以完全用语音进行,脱离双手的帮助;同时,利用唤醒这样的机制,设备不需要时时处于工作状态,大大节省能耗。语音唤醒的关键是进行关键词匹配。目前在进行关键词匹配时,首先对声音信号进行语音活动检测(VoiceActivityDetection,VAD),从声音信号中提取出语音信号,然后利用语音信号进行关键词匹配,判断语音信号中是否包含唤醒关键词。由于语音活动检测不完善,导致有效语音(即浊音)的首尾和中间都可能存在噪音和清音,并且清音复杂多变,从而使得系统的计算量较大,增大了系统的功耗。同时,清音和噪音等干扰项对匹配的特征参数的稳健性产生了不利影响, ...
【技术保护点】
1.一种语音处理方法,其特征在于,包括以下步骤:对声音信号进行语音活动检测,从所述声音信号中提取出语音信号;对所述语音信号进行浊音检测,从所述语音信号中提取出浊音片段;利用所述浊音片段进行关键词匹配。
【技术特征摘要】
1.一种语音处理方法,其特征在于,包括以下步骤:对声音信号进行语音活动检测,从所述声音信号中提取出语音信号;对所述语音信号进行浊音检测,从所述语音信号中提取出浊音片段;利用所述浊音片段进行关键词匹配。2.根据权利要求1所述的语音处理方法,其特征在于:所述对声音信号进行语音活动检测的步骤包括:基于过零率对声音信号进行语音活动检测,所述过零率的门限值为第一门限值;所述对所述语音信号进行浊音检测的步骤包括:基于过零率对所述语音信号进行浊音检测,所述过零率的门限值为第二门限值,且所述第二门限值大于所述第一门限值。3.根据权利要求2所述的语音处理方法,其特征在于,所述基于过零率对所述语音信号进行浊音检测,从所述语音信号中提取出浊音片段的步骤包括:针对所述语音信号的语音帧中相邻的两个采样点tmp1和tmp2,当同时满足tmp1*tmp2<0和|tmp1-tmp2|>T2时,则认定所述语音帧过一次零,据此统计出所述语音帧的过零率,其中T2为第二门限值;从所述语音信号中提取出过零率大于预设值的语音帧组成浊音片段。4.根据权利要求2所述的语音处理方法,其特征在于,所述基于过零率对所述语音信号进行浊音检测,从所述语音信号中提取出浊音片段的步骤包括:针对所述语音信号中相邻的采样点对tmp1和tmp2,当同时满足tmp1*tmp2<0和|tmp1-tmp2|>T2时,则判决过零率为1,否则判决过零率为0,其中T2为第二门限值;从所述语音信号中提取出所有过零率为1的采样点对所对应的数据段组成浊音片段。5.根据权利要求1-4任一项所述的语音处理方法,其特征在于,所述对声音信号进行语音活动检测的步骤之前还包括:对所述声音信号进行滤波处理,以滤除...
【专利技术属性】
技术研发人员:安黄彬,
申请(专利权)人:深圳市沃特沃德股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。