一种基于CNN的婴儿哭声检测方法及装置制造方法及图纸

技术编号:45524364 阅读:15 留言:0更新日期:2025-06-13 17:25
发明专利技术提供了一种基于CNN的婴儿哭声检测方法及装置,包括:S1:对于通过预处理得到的数字信号进行快速傅里叶变换(FFT)得到相应的频谱图,以及对频谱图的模长进行平方运算,获得功率谱图;S2:将数字信号、频谱图以及功率谱图进行叠加,获得预设数据类型的输入数据,并缩放至适合于CNN的输入尺寸,作为训练集;S3:将训练集输入优化验证模型进行优化验证处理,得到训练好的模型;本发明专利技术通过多维度数据融合与高效的模型训练机制,显著提升了婴儿哭声检测的准确性与可靠性,在婴儿监护等相关领域具有极高的应用价值与广阔的市场前景。

【技术实现步骤摘要】

本专利技术涉及智能语音识别,特别是涉及一种基于cnn的婴儿哭声检测方法及装置。


技术介绍

1、在现代社会中,婴儿的健康与安全受到越来越多家庭的关注。婴儿哭声是其表达需求的重要方式,及时识别和响应婴儿的哭声对于父母或看护者来说至关重要。

2、常见的婴儿哭声算法通常使用mfcc特征作为输入,该特征对于人声语音有较好的提取效果,但对婴儿哭声并不一定合适。

3、因此,本专利技术提出了一种利用叠加音频数据,以至少部分地解决上述问题。


技术实现思路

1、鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于cnn的婴儿哭声检测方法及装置。

2、为了解决上述问题,本专利技术公开了一种基于cnn的婴儿哭声检测方法,包括:

3、s1:对于通过预处理得到的数字信号进行快速傅里叶变换(fft)得到相应的频谱图,以及对频谱图的模长进行平方运算,获得功率谱图;

4、s2:将数字信号、频谱图以及功率谱图进行叠加,获得预设数据类型的输入数据,并本文档来自技高网...

【技术保护点】

1.一种基于CNN的婴儿哭声检测方法,其特征在于,包括:

2.根据权利要求1所述的基于CNN的婴儿哭声检测方法,其特征在于,所述预处理依次包括获取音频信号;对输入音频信号进行滑动窗口分割,将连续音频信号划分为固定长度的帧;对每帧进行PCM采样,将模拟音频信号转换为数字信号。

3.根据权利要求2所述的基于CNN的婴儿哭声检测方法,其特征在于,通过步长可调滑动窗口对音频信号进行分割,获得重叠程度可控的预设长度的帧。

4.根据权利要求3所述的基于CNN的婴儿哭声检测方法,其特征在于,

5.根据权利要求1所述的基于CNN的婴儿哭声检测方法,其特征在...

【技术特征摘要】

1.一种基于cnn的婴儿哭声检测方法,其特征在于,包括:

2.根据权利要求1所述的基于cnn的婴儿哭声检测方法,其特征在于,所述预处理依次包括获取音频信号;对输入音频信号进行滑动窗口分割,将连续音频信号划分为固定长度的帧;对每帧进行pcm采样,将模拟音频信号转换为数字信号。

3.根据权利要求2所述的基于cnn的婴儿哭声检测方法,其特征在于,通过步长可调滑动窗口对音频信号进行分割,获得重叠程度可控的预设长度的帧。

4.根据权利要求3所述的基于cnn的婴儿哭声检测方法,其特征在于,

5.根据权利要求1所述的基于cnn的婴儿哭声检测方法,其特征在于,所述数字信号进行快速傅里叶变换,得到待处理频谱图;

6.根据权利要求1所述的基于cnn的婴儿哭声检测...

【专利技术属性】
技术研发人员:郑楚升
申请(专利权)人:深圳市瑞讯云技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1