语音唤醒方法及装置制造方法及图纸

技术编号:26224630 阅读:37 留言:0更新日期:2020-11-04 10:59
本公开公开了一种语音唤醒方法、装置、电子设备和计算机可读存储介质。其中方法包括:获取语音信号;将所述语音信号输入第一模型,通过所述第一模型输出所述语音信号中每一帧音素的第一后验概率;将所述第一后验概率满足第一唤醒条件的音素对应的语音信号作为唤醒语音段;将所述唤醒语音段的语谱图和后验概率图输入第二模型,通过所述第二模型输出所述唤醒语音段中每一帧音素的第二后验概率;若所述第二后验概率满足第二唤醒条件,则进行唤醒操作。本公开实施例通过二次唤醒确认,可以减少误唤醒率,提高唤醒准确率。

【技术实现步骤摘要】
语音唤醒方法及装置
本公开涉及人工智能
,特别是涉及一种语音唤醒方法、装置和计算机可读存储介质。
技术介绍
随着人工智能的快速发展,智能设备在大众中的普及度越来越高,关于各家厂商智能设备(例如智能音箱)的评测也越来越多,智能设备的初级体验已经不足以满足广大用户,这也就带来了智能设备优化的需求。在现有技术中,通常通过语音方式实现交互,例如智能音箱、手机、平板等,但在用户的对其进行唤醒的过程中,经常会出现误唤醒率较高的问题。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开解决的技术问题是提供一种语音唤醒方法,以至少部分地解决现有技术中误唤醒率较高的技术问题。此外,还提供一种语音唤醒装置、语音唤醒硬件装置、计算机可读存储介质和语音唤醒终端。为了实现上述目的,根据本公开的一个方面,提供以下技术方案:r>一种语音唤醒方法本文档来自技高网...

【技术保护点】
1.一种语音唤醒方法,其特征在于,包括:/n获取语音信号;/n将所述语音信号输入第一模型,通过所述第一模型输出所述语音信号中每一帧音素的第一后验概率;/n将所述第一后验概率满足第一唤醒条件的音素对应的语音信号作为唤醒语音段;/n将所述唤醒语音段的语谱图和后验概率图输入第二模型,通过所述第二模型输出所述唤醒语音段中每一帧音素的第二后验概率;/n若所述第二后验概率满足第二唤醒条件,则进行唤醒操作。/n

【技术特征摘要】
1.一种语音唤醒方法,其特征在于,包括:
获取语音信号;
将所述语音信号输入第一模型,通过所述第一模型输出所述语音信号中每一帧音素的第一后验概率;
将所述第一后验概率满足第一唤醒条件的音素对应的语音信号作为唤醒语音段;
将所述唤醒语音段的语谱图和后验概率图输入第二模型,通过所述第二模型输出所述唤醒语音段中每一帧音素的第二后验概率;
若所述第二后验概率满足第二唤醒条件,则进行唤醒操作。


2.根据权利要求1所述的语音唤醒方法,其特征在于,所述将所述第一后验概率满足第一唤醒条件的音素对应的语音信号作为唤醒语音段,包括:
若所述第一后验概率满足第一唤醒条件,则记录唤醒时间点;
确定所述语音信号中唤醒词的起始时间点;
根据所述唤醒时间点和所述起始时间点确定唤醒长度,并确定唤醒语音段。


3.根据权利要求2所述的语音唤醒方法,其特征在于,所述确定所述语音信号中唤醒词的起始时间点,包括:
确定所述唤醒词的第一个字的各个音素在所述唤醒语音段的每一帧中的后验概率;
将所述第一个字的各个音素的后验概率相加,得到所述第一个字的各个音素在每一帧中的概率和;
将所述概率和最大值对应的第一帧数对应的时间点作为起始时间点。


4.根据权利要求1所述的语音唤醒方法,其特征在于,所述方法还包括:
计算所述唤醒语音段每个时间点的频谱能量密度;
对所有的频谱能量密度进行归一化处理,得到所述唤醒语音段的语...

【专利技术属性】
技术研发人员:杨晓帆冯大航陈孝良
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1