语音识别方法、装置、智能设备系统以及存储介质制造方法及图纸

技术编号:37963695 阅读:14 留言:0更新日期:2023-06-30 09:39
本申请公开了一种语音识别方法、装置、智能设备系统以及存储介质,属于语音识别领域。方法包括:获取第一音频信息和第二音频信息;对第一音频信息的第二音频信息进行短时傅里叶变换,获得第一频域信息和第二频域信息;根据距离信息,获得第一音频信息和第二音频信息之间的匹配帧间隔时长;基于匹配帧间隔时长,对第一频谱帧和第二频谱帧进行匹配和比对,以从第一音频信息或第二音频信息中识别并滤除第一音频设备的设备输出音频,获得滤除设备输出音频后的待识别语音信息;对待识别语音信息进行语音识别,获得语音控制信息。本申请使得采集到的音频信息中的成分变得简单,进而提高分析语音识别的正确度。分析语音识别的正确度。分析语音识别的正确度。

【技术实现步骤摘要】
语音识别方法、装置、智能设备系统以及存储介质


[0001]本申请涉及语音识别领域,尤其涉及一种语音识别方法、装置、智能设备系统以及存储介质。

技术介绍

[0002]相关技术中,在使用智能产品时,用户在语音控制智能产品时,智能产品将在采集的包含用于控制语音指令的语音信息中直接分析提取用户的控制语音指令,并根据确定的控制语音指令控制对应的智能家居设备。
[0003]然而,对于智能音箱、智能眼镜或者电视机等具有音频输出功能的智能设备而言,当其音频播放功能处于运行状态时,由于音频播放功能提供的背景音,会导致智能语音设备采集的用户语音的语音信息十分复杂,此时,直接进行控制语音指令的提取,会导致分析识别用户控制语音指令的准确率不高。
[0004]申请内容
[0005]本申请的主要目的在于提供一种语音识别方法、装置、智能设备系统以及存储介质,旨在解决智能设备的音频播放功能处于运行状态时,识别用户控制语音指令的准确率不高的技术问题。
[0006]为实现上述目的,本申请提供一种语音识别方法,方法包括:
[0007]获取第一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取第一音频设备采集的第一音频信息和第二音频设备采集的第二音频信息;对所述第一音频信息进行短时傅里叶变换,获得第一频域信息,并对所述第二音频信息进行短时傅里叶变换,获得第二频域信息;所述第一频域信息包括按照时间排序的多帧第一频谱帧,所述第二频域信息包括按照时间排序的多帧第二频谱帧;根据所述第一音频设备和所述第二音频设备之间的距离信息,获得所述第一音频信息和所述第二音频信息之间的匹配帧间隔时长;基于所述匹配帧间隔时长,对所述第一频谱帧和所述第二频谱帧进行匹配和比对,以从所述第一音频信息或所述第二音频信息中识别并滤除所述第一音频设备的设备输出音频,获得待识别语音信息;对所述待识别语音信息进行语音识别,获得语音控制信息。2.根据权利要求1所述的语音识别方法,其特征在于,所述根据所述第一音频设备和所述第二音频设备之间的距离信息,获得所述第一音频信息和所述第二音频信息之间的匹配帧间隔时长,包括;根据所述距离信息和音速,获得所述设备输出音频在所述第一音频设备和所述第二音频设备之间的传播时长;将所述传播时长作为所述匹配帧间隔时长。3.根据权利要求1所述的语音识别方法,其特征在于,所述基于所述匹配帧间隔时长,对所述第一频谱帧和所述第二频谱帧进行匹配和比对,以从所述第一音频信息或所述第二音频信息中识别并滤除所述第一音频设备的设备输出音频,获得待识别语音信息,包括:从所述第二频域信息中确定出与各所述第一频谱帧间隔所述匹配帧间隔时长的目标第二频谱帧,获得多个匹配帧组;对所述匹配帧组进行对比,根据比对结果识别出所述第一音频设备的设备输出音频;从所述第一音频信息或所述第二音频信息中滤除所述第一音频设备的设备输出音频,获得所述待识别语音信息。4.根据权利要求3所述的语音识别方法,其特征在于,所述从所述第一音频信息或所述第二音频信息中滤除所述第一音频设备的设备输出音频,获得所述待识别语音信息,包括:将所述设备输出音频的频谱从所述第一频谱帧中滤除,获得处理后的第一频谱帧;基于所述处理后的第一频谱帧,获得处理后的第一频域信息;对所述处理后的第一频域信息进行逆短时傅里叶变换处理,获得所述待识别语音信息。5.根据权利要求1所述的语音识别方法,其特征在于,所述获取第一音频设备采集的第一音频信息和第二音频设备采集的第二音频信息之前,所述方法还包括:当监测到预设关键...

【专利技术属性】
技术研发人员:张文松赵江涛杨华泽
申请(专利权)人:歌尔股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1