一种声学场景分类方法技术

技术编号:31371840 阅读:18 留言:0更新日期:2021-12-15 10:12
本发明专利技术公开了一种声学场景分类方法,包括以下步骤:首先针对采用参考设备录制的场景数据,训练基本场景分类模型;然后根据采用移动设备录制的场景数据,训练设备独立场景分类模型;根据训练好的设备独立场景分类模型,训练设备分类模型;利用训练好的设备分类模型提取设备特性,结合设备分类模型,获得设备识别模型;所有模型建立之后,进行数据自动录制并收集存储,并对收集的录制数据进行声学场景命名,并存储至云端;根据用户参数,获得个性化定制的场景分类模型。本发明专利技术提供了一种声学场景分类方法,加入设备分类和识别功能,对用户的使用设备及数据收集和整理,定制特定的声学场景分类模型,提升系统性能,为用户带来较佳的体验感。体验感。体验感。

【技术实现步骤摘要】
一种声学场景分类方法


[0001]本专利技术涉及声学场景分类领域,尤其涉及一种声学场景分类方法。

技术介绍

[0002]随着智能语音技术的快速发展和人工智能相关应用的兴起,声学场景分类技术已逐渐被应用到人们的日常生活中。声学场景分类技术是利用音频信号处理和深度学习技术完成对声学场景(家庭、公园和街道场景等)的识别与分类,从而达到识别周围环境的目的。
[0003]声学场景分类技术在人们的生活中有着广泛的作用,如上下文感知服务、可穿戴智能设备和机器人导航系统等。在基于场景分类的自适应降噪技术中,若判断当前场景为机场,自动开启机场去噪模式,若判断为街道场景,则开启街道去噪模式;HUAWEI 动态降噪耳机,利用ASC技术快速辨认周围环境,主动切换到恰当的降噪模式,削弱安静场景下的空调、冰箱等机器噪声,削弱地铁和飞机带来的重低频噪声,使用户静享安逸,远离喧嚣。在基于场景的ASR技术中,智能机器可以自主加载特定声学环境下的声学模型,以达到对该场景下语音的精准识别。ASC技术也用于盲人助听器和机器人轮椅时,设备可根据周围环境变化进行功能自主调节。以上本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声学场景分类方法,其特征在于,包括以下步骤:首先针对采用参考设备录制的场景数据,训练基本场景分类模型;然后根据采用移动设备录制的场景数据,训练设备独立场景分类模型;根据训练好的设备独立场景分类模型,训练设备分类模型;利用训练好的设备分类模型提取设备特性,结合设备分类模型,获得设备识别模型;所有模型建立之后,进行数据自动录制并收集存储,并对收集的录制数据进行声学场景命名,并存储至云端;根据用户参数,获得个性化定制的场景分类模型。2.如权利要求1所述的一种声学场景分类方法,其特征在于,首先针对采用参考设备录制的场景数据,训练基本场景分类模型,具体包括:利用参考设备A的声学场景数据集,提取对数梅尔频谱图作为声学特征,用9层卷积神经网络对所述声学场景数据集的声学特征进行训练,获得基本场景分类模型A

ASC。3.如权利要求2所述的一种声学场景分类方法,其特征在于,提取对数梅尔频谱图作为声学特征之前,对所述声学场景数据集进行预处理,再对预处理后的音频数据进行语音分析,提取对数梅尔频谱图作为声学特征。4.如权利要求3所述的一种声学场景分类方法,其特征在于,对数梅尔声谱图是将声学场景数据集中的音频数据进行傅里叶变换转换到频域上,采用梅尔频率滤波器对频域信号进行再处理;然后接入一组梅尔频率滤波器,将声谱图转换到更符合人耳听觉的Mel域,获得维度较低的梅尔频谱图,在梅尔频谱图的基础上,将每个频段的特征值进行对数运算,可以获得对数梅尔频谱图。5.如权利要求1所述的一种声学场景分类方法,其特征在于,然后根据采用移动设备录制的场景数据,训练设备独立场景分类模型,具体包括:从一个或多个移动设备录制的音频形成移动设备音频数据集,提取移动设备音频数据集中数据的声学特征,并在所述基本场景分类模型A

ASC上进行微调,获得与设备无关的设备独立场景分类模型BC

ASC。6.如权利要求5所述的一种声学场景分类方法,其特征在于,根据训练好的设备独立场景分类模型,训练设备分类模型,具体包括:加载训练好的所述设备独立场景分类模型BC

ASC,分别提取声学场景数据集、不同设备录制的同一信号的数据集的网络中层表征;根据声学场景数据集的...

【专利技术属性】
技术研发人员:龙艳花刘悦梁芸浩魏爽
申请(专利权)人:上海师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1