一种利用机器听觉检测扬声器状态的方法和系统技术方案

技术编号:39597493 阅读:6 留言:0更新日期:2023-12-03 19:56
本发明专利技术属于机器听觉检测技术领域,具体涉及一种利用机器听觉检测扬声器状态的方法和系统,所述机器听觉检测系统包括声音信息获取模块

【技术实现步骤摘要】
一种利用机器听觉检测扬声器状态的方法和系统


[0001]本专利技术属于机器听觉检测
,具体涉及一种利用机器听觉检测扬声器状态的方法和系统


技术介绍

[0002]机器听觉是指机器通过模拟人类听觉系统,实现对声音和音频信号的感知和理解能力,它可以用于语音识别

语音合成

音频分析等领域,在语音识别方面,机器听觉可以将语音信号转换为文本,使得机器可以理解和处理语音信息,这在语音助手

语音识别软件和智能音箱等应用中得到广泛应用,另外,机器听觉也可以用于语音合成,通过分析文本,机器可以生成自然流畅的语音输出,实现与人类的交互,此外,机器听觉还可以进行音频分析,如声音分类

声音增强

音乐分析等,通过对音频信号的处理和分析,机器可以提取有用的信息,并作出相应的响应或决策,机器听觉技术的发展为人机交互

语音识别和语音合成等领域带来了巨大的进步,为我们的生活带来了更多的便利和可能性;
[0003]现有的机器听觉检测系统对于扬声器状态的检测时对于噪音去除的方式较为单一,在不同工作场景下不便于消除干扰信号,声音信息的获取准确性较差,为此我们提出一种利用机器听觉检测扬声器状态的方法和系统来解决上述问题


技术实现思路

[0004]本专利技术的目的是提供一种利用机器听觉检测扬声器状态的方法和系统,能够提供更准确的状态评价,提高系统的整体性能,多种去噪方式能够有效的消除干扰信号,能够提高声音信息获取的准确性

[0005]本专利技术采取的技术方案具体如下:
[0006]一种利用机器听觉检测扬声器状态的方法和系统,所述机器听觉检测系统包括声音信息获取模块

初始声音信息处理模块

声源定位模块

多传感器信息融合模块

扬声器状态评价模块

[0007]在一种优选方案中,所述声音信息获取模块为仿造人耳的听觉系统,将多个传声器组成的阵列作为机器人的“双耳”对声音信息进行处理,所述传声器阵列是由多个传声器构成一定几何形状而组成的阵列,所述传声器阵列具有很强的空间选择性,同时还可以在一定的范围内实现声源的自适应检测定位及跟踪,所述传声器阵列的构建包括阵元间距

阵元个数和采用的麦克风类型

[0008]在一种优选方案中,所述初始声音信息处理模块运行包括声音信号的放大

滤波


/
数转换

去噪,由于麦克风的拾音范围有限,当声源距离麦克风较远时,麦克风采集到的信号很小,因此,有必要对麦克风采集到的模拟信号进行放大,滤波是将系统采集到的原始信号进行格式转换,并将不感兴趣的频段信号加以滤除,为后续算法处理提供理想的数字信号,由于初始声音信号中包括了背景噪声和回声等干扰,影响了声源定位的精度,因此去噪问题十分重要,如果噪声信号的特性可以被单独测量,那么声音信息获取的准确性就会
大大提高

[0009]在一种优选方案中,所述声源定位模块通过传声器拾取语音信号,并采用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置

[0010]在一种优选方案中,所述多传感器信息融合模块运行为不断接收扬声器的声波,根据声波的变化随时调整接收的方向,通过仿生学的方法,利用音频听觉

摄像头视觉和超声装置等多个传感器信息的综合来提高听觉定位的精度和鲁棒性

[0011]在一种优选方案中,所述扬声器状态评价模块使用机器学习或信号处理技术,从预处理后的音频数据中提取有关声音的特征,使用已标记的音频数据集,训练一个机器学习模型,以识别不同状态下的扬声器声音,用另一组未标记的音频数据进行测试和验证,将这些音频数据输入已训练好的模型中,观察模型对声音状态的检测准确性,根据模型的输出,可以判断扬声器的声音是正常的还是存在问题

[0012]在一种优选方案中,所述传声器阵列的几何结构包括直线阵

平面阵和三维阵,所述均匀直线阵列结构简单,但不适用于全向定位,所述平面阵可用于全向定位,性价比高,但不太适用于近场定位,所述三维阵包括近场模型及远场模型,所述近场模型和远场模型最主要的区别在于是否考虑麦克风阵列各阵元因接收信号幅度衰减的不同所带来的影响

[0013]在一种优选方案中,一种利用机器听觉检测扬声器状态的方法和系统,所述利用机器听觉检测扬声器状态的方法包括以下步骤:
[0014]步骤
1.
去噪;
[0015]广义互相关法:对信号和噪声进行白化处理,增强信号中信噪比较高的频率成分,对背景噪声和回声都起到一定的抑制作用;
[0016]基于建立信号和互功率时延估计法:利用了人耳定位原理,能在很大程度上抑制回声的影响,彻底抑制背景噪声,在低信噪比环境下有较好的去噪效果;
[0017]优先效应法:原声到达后,混响经一段时延才第一次到达并且开始干扰

在这个短暂时间,信号不包含回响部分,可用来进行无回响干扰的定位计算,将小波变换引入声源定位,可以有效解决与目标声源相似的背景噪声的去除问题,实现目标声源的识别和分离;
[0018]步骤
2.
声源定位:基于时延估计的声源定位方法:先进行声达时间差估计,并从中获取传声器阵列中阵元间的声延迟,再利用获取的声达时间差,结合已知的传声器阵列的空间位置进一步定出声源的位置,估计时延通常采用相位数据法

广义相关法

基于自适应滤波的参数模型法

谱细化方法和相关峰插值法;空间搜索算法主要有基于目标函数搜索的算法

基于空间几何的算法和基于线性内插值的算法;
[0019]步骤
3.
传感器信息融合:
[0020]独立决策融合:首先听觉

视觉传感器根据各自的信息进行独立决策,然后再将各决策结果进行融合,这种方法的特点是融合过程简单,但容易丢失有用信息;
[0021]整合准测融合:首先将听觉

视觉传感器信息按照一定准则进行融合,再依据融合后的信息进行决策,这种方法定位更为准确

[0022]本专利技术取得的技术效果为:通过利用传声器阵列和声源定位模块,可以准确地确定和跟踪声源的空间位置,这有助于定位扬声器的位置和方向,从而提供更准确的状态评价;
[0023]通过综合音频听觉

摄像头视觉和超声装置等多个传感器的信息,可以提高听觉
定位的精度和鲁棒性,这种信息融合可以弥补单一传感器的局限性,提高系统的整体性能;
[0024]初始声音信息处理模块中的去噪步骤可以有效地减少背景噪声和回声等干本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种利用机器听觉检测扬声器状态的方法和系统,其特征在于:所述机器听觉检测系统包括声音信息获取模块

初始声音信息处理模块

声源定位模块

多传感器信息融合模块

扬声器状态评价模块
。2.
根据权利要求1所述的一种利用机器听觉检测扬声器状态的方法和系统,其特征在于:所述声音信息获取模块为仿造人耳的听觉系统,将多个传声器组成的阵列作为机器人的“双耳”对声音信息进行处理,所述传声器阵列是由多个传声器构成一定几何形状而组成的阵列,所述传声器阵列具有很强的空间选择性,同时还可以在一定的范围内实现声源的自适应检测定位及跟踪,所述传声器阵列的构建包括阵元间距

阵元个数和采用的麦克风类型
。3.
根据权利要求1所述的一种利用机器听觉检测扬声器状态的方法和系统,其特征在于:所述初始声音信息处理模块运行包括声音信号的放大

滤波


/
数转换

去噪,由于麦克风的拾音范围有限,当声源距离麦克风较远时,麦克风采集到的信号很小,因此,有必要对麦克风采集到的模拟信号进行放大,滤波是将系统采集到的原始信号进行格式转换,并将不感兴趣的频段信号加以滤除,为后续算法处理提供理想的数字信号,由于初始声音信号中包括了背景噪声和回声等干扰,影响了声源定位的精度,因此去噪问题十分重要,如果噪声信号的特性可以被单独测量,那么声音信息获取的准确性就会大大提高
。4.
根据权利要求1所述的一种利用机器听觉检测扬声器状态的方法和系统,其特征在于:所述声源定位模块通过传声器拾取语音信号,并采用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置
。5.
根据权利要求1所述的一种利用机器听觉检测扬声器状态的方法和系统,其特征在于:所述多传感器信息融合模块运行为不断接收扬声器的声波,根据声波的变化随时调整接收的方向,通过仿生学的方法,利用音频听觉

摄像头视觉和超声装置等多个传感器信息的综合来提高听觉定位的精度和鲁棒性
。6.
根据权利要求1所述的一种利用机器听觉检测扬声器状态的方法和系统,其特征在于:所述扬声器状态评价模块使用机器学习或信号处理技术,从预处理后的音频数据中提取有关声音的特征,使用已标记的音频数据集,训练一个机器学习模...

【专利技术属性】
技术研发人员:邹晓东师芳慧王鹏吴杨王佳
申请(专利权)人:北京研信通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1