一种音频实时场景识别系统技术方案

技术编号:40076793 阅读:20 留言:0更新日期:2024-01-17 01:31
本发明专利技术公开了一种音频实时场景识别系统,涉及音频识别技术领域,包括:音频特征信息提取单元,音频特征信息提取单元用于对音频文件中包含的音频特征信息进行提取,并整合获得音频特征信息数据集U;特征信息分析单元,计算获取的音频特征信息数据集U中各音频特征信息X的有效系数Px;特征信息选取单元,基于计算获取的各个音频特征信息的有效系数Px选取预设数量Sy的音频特征信息X。音频场景识别模型,将选取的音频特征信息X导入音频场景识别模型中进行识别以确定音频文件对应的音频场景。本发明专利技术基于有效系数评估各音频特征信息的代表性和有效性,消除无效音频特征信息或冗余音频特征信息,降低音频场景识别计算复杂性,提高识别的准确性。

【技术实现步骤摘要】

本专利技术涉及音频识别,具体为一种音频实时场景识别系统


技术介绍

1、音频场景识别广泛应用于设备的环境感知,音频场景识别作为场景识别中的一个研究方向,音频场景识别通过分析音频来提取其所处的环境信息,音频包含与场景相关的丰富信息,使基于音频的场景识别成为可能,音频场景识别是一种通过提取场景音频信号的特征自动确定设备周围场景的过程,可以使各种便携式设备更加智能,一些电子产品可以根据周围不同的场景而自动的调节各种情景模式。

2、如申请公布号为:cn113793622a,申请公布日为2021.12.14,名称为《一种音频场景识别方法、系统及装置》,其通过残差网络结构的神经网络在大量数据进行训练时,保障提取的深度嵌入特征在识别时具有更高的准确率,以及极大地提升对短时音频的识别性能,但是公知的,音频场景识别的主要任务是从音频样本中提取特征信息,依据模式匹配算法识别音频样本,只有在特征信息中包含了足够多的类别信息,才能通过分类器实现正确分类,而特征参数中是否包含有足够的类别信息却很难确定,通常在实际应用中,特征信息是否有效往往是未知的,所以会通过提取大量特本文档来自技高网...

【技术保护点】

1.一种音频实时场景识别系统,其特征在于,包括:

2.根据权利要求1所述的一种音频实时场景识别系统,其特征在于,所述音频特征信息提取单元对音频文件中包含的音频特征信息进行提取具体为,

3.根据权利要求2所述的一种音频实时场景识别系统,其特征在于,计算各音频特征信息X的有效系数时对每个标签数据集中的各音频特征信息X进行独立计算。

4.根据权利要求2所述的一种音频实时场景识别系统,其特征在于,计算各音频特征信息X的有效系数具体为:

5.根据权利要求4所述的一种音频实时场景识别系统,其特征在于,各音频特征信息X的有效评估系数的计算公式为:

...

【技术特征摘要】

1.一种音频实时场景识别系统,其特征在于,包括:

2.根据权利要求1所述的一种音频实时场景识别系统,其特征在于,所述音频特征信息提取单元对音频文件中包含的音频特征信息进行提取具体为,

3.根据权利要求2所述的一种音频实时场景识别系统,其特征在于,计算各音频特征信息x的有效系数时对每个标签数据集中的各音频特征信息x进行独立计算。

4.根据权利要求2所述的一种音频实时场景识别系统,其特征在于,计算各音频特征信息x的有效系数具体为:

5.根据权利要求4所述的一种音频实时场景识别系统,其特征在于,各音频特征信息x的有效评估系数的计算公式为:

6.根据权利要求4所述的一种音频实时场景识别系...

【专利技术属性】
技术研发人员:陈国强
申请(专利权)人:富迪科技南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1