一种语音信号检测方法与装置制造方法及图纸

技术编号：15705554 阅读：304 留言：0更新日期：2017-06-26 14:19

本申请公开了一种语音信号检测方法与装置，用于解决现有技术中的语音信号检测方法存在的处理速度较慢，且耗费资源较多的问题。该方法包括：获取音频信号；根据预设语音信号的频率，将所述音频信号划分为多个短时能量帧；确定每个短时能量帧的能量；根据每个短时能量帧的能量，检测所述音频信号中是否包含语音信号。

Method and device for detecting speech signal

The invention discloses a method and a device for detecting a speech signal, which is used to solve the problems of slower processing speed and more resource consumption in the prior art of speech signal detection method. The method includes: obtaining audio signals; according to the preset voice signal frequency, the audio signal is divided into a plurality of short-time energy frame; short-time energy energy is determined for each frame; each frame according to the short-time energy energy, detecting whether the audio signal contained in the speech signal.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音信号检测方法与装置
本申请涉及计算机
，尤其涉及一种语音信号检测方法与装置。
技术介绍
在实际生活中，人们会经常使用智能设备(例如智能手机、平板电脑等)来发送语音消息。但是人们在使用智能设备发送语音消息时，往往需要点击智能设备屏幕中的开始或结束按钮，才能够完成语音消息的发送，而这些点击操作，会给用户造成诸多不便。若用户无需点击按钮便可完成语音消息的发送，那么智能设备需要一直进行录音或者按照预设周期进行录音，并判断获取到的音频信号中是否包含语音信号，若包含语音信号，便将该语音信号提取出来，然后进行后续处理并发送出去，这样便完成了语音消息的发送。现有技术中，一般采用双门限方法、基于自相关极大值的检测方法或基于小波变换的检测方法等语音信号检测方法，来检测获取到的音频信号中是否包含语音信号。但是该些方法基本都是通过傅里叶变换等复杂的计算，获取音频信息的频率特征，进而根据该频率特征来确定是否包含语音信号的，需要计算较大缓冲数据，内存占用较高，计算量偏大，处理速度较慢，且耗电量较大。
技术实现思路
本申请实施例提供一种语音信号检测方法与装置，用于解决现有技术中的语音信号检测方法存在的处理速度较慢，且耗费资源较多的问题。本申请实施例采用下述技术方案：一种语音信号检测方法，所述方法包括：获取音频信号；根据预设语音信号的频率，将所述音频信号划分为多个短时能量帧；确定每个短时能量帧的能量；根据每个短时能量帧的能量，检测所述音频信号中是否包含语音信号。一种语音信号检测装置，所述装置包括：获取模块，获取音频信号；划分模块，根据预设语音信号的频率，将所述音频信号划分为多个...
一种语音信号检测方法与装置

【技术保护点】
一种语音信号检测方法，其特征在于，所述方法包括：获取音频信号；根据预设语音信号的频率，将所述音频信号划分为多个短时能量帧；确定每个短时能量帧的能量；根据每个短时能量帧的能量，检测所述音频信号中是否包含语音信号。

【技术特征摘要】
1.一种语音信号检测方法，其特征在于，所述方法包括：获取音频信号；根据预设语音信号的频率，将所述音频信号划分为多个短时能量帧；确定每个短时能量帧的能量；根据每个短时能量帧的能量，检测所述音频信号中是否包含语音信号。2.如权利要求1所述的方法，其特征在于，获取音频信号，具体包括：获取当前音频信号；在上一次获取到的音频信号中，截取预设时段的子信号；将所述当前音频信号和截取的子信号进行拼接，作为获取到的音频信号。3.如权利要求1所述的方法，其特征在于，根据预设语音信号的频率，将所述音频信号划分为多个短时能量帧，具体包括：根据预设语音信号的频率，确定出所述预设语音信号的周期；按照确定出的周期，将所述音频信号划分为对应的时长均为所述周期的多个短时能量帧。4.如权利要求1所述的方法，其特征在于，根据每个短时能量帧的能量，检测所述音频信号中是否包含语音信号，具体包括：确定能量大于预设阈值的短时能量帧的数量占所有短时能量帧总数量的比率；判断所述比率是否大于预设比率；若是，则确定检测到所述音频信号中包含语音信号；若否，则确定未检测到所述音频信号中包含语音信号。5.如权利要求1所述的方法，其特征在于，根据每个短时能量帧的能量，检测所述音频信号中是否包含语音信号，具体包括：确定能量大于预设阈值的短时能量帧的数量占所有短时能量帧总数量的比率；判断所述比率是否大于预设比率；若否，则确定未检测到所述音频信号中包含语音信号；若是，则当能量大于预设阈值的短时能量帧中存在至少N个连续短时能量帧时，确定检测到所述音频信号中包含语音信号，当能量大于预设阈值的短时能...

【专利技术属性】
技术研发人员：焦雷，官砚楚，曾晓东，林锋，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人