【技术实现步骤摘要】
本专利技术涉及智能语音识别,特别是涉及一种基于cnn的婴儿哭声检测方法及装置。
技术介绍
1、在现代社会中,婴儿的健康与安全受到越来越多家庭的关注。婴儿哭声是其表达需求的重要方式,及时识别和响应婴儿的哭声对于父母或看护者来说至关重要。
2、常见的婴儿哭声算法通常使用mfcc特征作为输入,该特征对于人声语音有较好的提取效果,但对婴儿哭声并不一定合适。
3、因此,本专利技术提出了一种利用叠加音频数据,以至少部分地解决上述问题。
技术实现思路
1、鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于cnn的婴儿哭声检测方法及装置。
2、为了解决上述问题,本专利技术公开了一种基于cnn的婴儿哭声检测方法,包括:
3、s1:对于通过预处理得到的数字信号进行快速傅里叶变换(fft)得到相应的频谱图,以及对频谱图的模长进行平方运算,获得功率谱图;
4、s2:将数字信号、频谱图以及功率谱图进行叠加,获得预设数
...【技术保护点】
1.一种基于CNN的婴儿哭声检测方法,其特征在于,包括:
2.根据权利要求1所述的基于CNN的婴儿哭声检测方法,其特征在于,所述预处理依次包括获取音频信号;对输入音频信号进行滑动窗口分割,将连续音频信号划分为固定长度的帧;对每帧进行PCM采样,将模拟音频信号转换为数字信号。
3.根据权利要求2所述的基于CNN的婴儿哭声检测方法,其特征在于,通过步长可调滑动窗口对音频信号进行分割,获得重叠程度可控的预设长度的帧。
4.根据权利要求3所述的基于CNN的婴儿哭声检测方法,其特征在于,
5.根据权利要求1所述的基于CNN的婴儿哭
...【技术特征摘要】
1.一种基于cnn的婴儿哭声检测方法,其特征在于,包括:
2.根据权利要求1所述的基于cnn的婴儿哭声检测方法,其特征在于,所述预处理依次包括获取音频信号;对输入音频信号进行滑动窗口分割,将连续音频信号划分为固定长度的帧;对每帧进行pcm采样,将模拟音频信号转换为数字信号。
3.根据权利要求2所述的基于cnn的婴儿哭声检测方法,其特征在于,通过步长可调滑动窗口对音频信号进行分割,获得重叠程度可控的预设长度的帧。
4.根据权利要求3所述的基于cnn的婴儿哭声检测方法,其特征在于,
5.根据权利要求1所述的基于cnn的婴儿哭声检测方法,其特征在于,所述数字信号进行快速傅里叶变换,得到待处理频谱图;
6.根据权利要求1所述的基于cnn的婴儿哭声检测...
【专利技术属性】
技术研发人员:郑楚升,
申请(专利权)人:深圳市瑞讯云技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。