声学成像频率确定方法、装置、设备及存储介质制造方法及图纸

技术编号:25839833 阅读:24 留言:0更新日期:2020-10-02 14:19
本申请公开了一种声学成像频率确定方法、装置、设备及存储介质,本申请通过对采集的音频数据进行快速傅里叶变换,将其从时域转换为频域,得到频谱特征,进一步可以基于频谱特征确定各个预设频点的声源能量值,可以理解的是,一般性的,目标声源的能量值都是较大的,为此,可以基于各预设频点的声源能量值,确定出用于表征目标声源能量下限的声源能量阈值,进而可以基于频谱特征和声源能量阈值,确定出目标声源的初步成像频率。相比于现有技术,本申请方法能够过滤掉部分声源能量值较低的噪声源,筛选得到目标声源的成像频率,进而可以基于目标声源的成像频率进行声学成像,其成像效果更佳。

【技术实现步骤摘要】
声学成像频率确定方法、装置、设备及存储介质
本申请涉及声学成像
,更具体的说,是涉及一种声学成像频率确定方法、装置、设备及存储介质。
技术介绍
声学成像技术利用麦克风阵列技术确定声源位置,与摄像头结合,通过图像的方式展示声源的分布状态。图像以颜色和亮度表示声音的强弱。从而帮助人们快速定位噪声位置,解决人耳定位声音能力有限的问题。现实中,噪声往往是多源的,即同一时刻听到的声音可能来自不同的发声源的叠加,这些不同的声源,其发声频率也不尽相同,有些低频,有些高频。在声学成像中的表现,则体现在多个热力图,或者热力图定位不准确等。而在实际应用场景中,我们的目标声源往往希望是单一的,所以可以通过调整频率,来确定我们的热点频率范围,从而过滤掉干扰,使得声学定位更加的清晰和准确。现有技术一般由人工手动调节频率,而当用户不确定目标声源的频率范围时,为了保证能够成像,一般是暴力的选择全频段成像,这就会导致噪声源也会被成像,从而对目标声源形成干扰。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种声学成像方法、装置、设备及存储介质,以解决现有人工调节频率所存在的无法滤除噪声,成像效果不佳的问题。具体方案如下:一种声学成像频率确定方法,包括:对采集的音频数据进行快速傅里叶变换,得到频谱特征;基于所述频谱特征,确定各预设频点的声源能量值;基于各预设频点的声源能量值,确定用于表征目标声源能量下限的声源能量阈值;基于所述频谱特征及所述声源能量阈值,确定目标声源的初步成像频率范围。优选地,所述采集的音频数据包括多路音频数据;所述基于所述频谱特征,确定各预设频点的声源能量值,包括:基于各路音频数据分别对应的频谱特征,计算每一预设频点上能量幅值的累加值,得到每一预设频点的声源能量值。优选地,所述基于各预设频点的声源能量值,确定用于表征目标声源能量下限的声源能量阈值,包括:对各预设频点的声源能量值进行平均处理,结果作为用于表征目标声源能量下限的声源能量阈值;或,对各预设频点的声源能量值进行加权平均处理,结果作为用于表征目标声源能量下限的声源能量阈值,其中各频点的加权系数为预设值。优选地,所述基于所述频谱特征及所述声源能量阈值,确定目标声源的初步成像频率范围,包括:基于所述频谱特征,确定声源能量超过所述声源能量阈值的至少一个待定频段;基于所述至少一个待定频段,确定目标声源的初步成像频率范围。优选地,所述基于所述至少一个待定频段,确定目标声源的初步成像频率范围,包括:根据各所述待定频段对应的声源能量极大值,选取声源能量极大值最大的前N个待定频段,作为所述目标声源的初步成像频率范围。优选地,还包括:对所述目标声源的各初步成像频率范围进行有效性的标定,所述有效性用于表示初步成像频率范围是否为目标声源的有效成像频率范围。优选地,还包括:利用标定为有效的初步成像频率范围,结合当前采集的视频图像,生成当前的声学成像图。优选地,所述对所述目标声源的各初步成像频率范围进行有效性的标定,包括:针对各所述初步成像频率范围,结合当前采集的视频图像,生成当前的声学成像图;针对所述当前的声学成像图中,与每一初步成像频率范围对应的发声源图像位置,判断所述发声源图像位置相对于上一时刻的声学成像图是否发生变动;若否,则根据记录的上一时刻的声学成像图中所述发声源图像位置对应的初步成像频率范围的有效性,对当前的声学成像图中所述发声源图像位置对应的初步成像频率范围的有效性进行标定。优选地,还包括:若判断所述发声源图像位置相对于上一时刻的声学成像图发生变动,则对当前的声学成像图中所述发声源图像位置处的图像进行活体检测;若检测出活体对象,则将当前的声学成像图中所述发声源图像位置对应的初步成像频率范围标定为无效;若未检测出活体对象,则将当前的声学成像图中所述发声源图像位置对应的初步成像频率范围标定为有效。一种声学成像频率确定装置,包括:音频数据处理单元,用于对采集的音频数据进行快速傅里叶变换,得到频谱特征;声源能量值确定单元,用于基于所述频谱特征,确定各预设频点的声源能量值;声源能量阈值确定单元,用于基于各预设频点的声源能量值,确定用于表征目标声源能量下限的声源能量阈值;初步成像频率范围确定单元,用于基于所述频谱特征及所述声源能量阈值,确定目标声源的初步成像频率范围。一种声学成像频率确定设备,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现如上的声学成像频率确定方法的各个步骤。一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上的声学成像频率确定方法的各个步骤。借由上述技术方案,本申请的声学成像频率确定方法,通过对采集的音频数据进行快速傅里叶变换,将其从时域转换为频域,得到频谱特征,进一步可以基于频谱特征确定各个预设频点的声源能量值,可以理解的是,一般性的,目标声源的能量值都是较大的,为此,可以基于各预设频点的声源能量值,确定出用于表征目标声源能量下限的声源能量阈值,进而可以基于频谱特征和声源能量阈值,确定出目标声源的初步成像频率。相比于现有技术,本申请方法能够过滤掉部分声源能量值较低的噪声源,筛选得到目标声源的成像频率,进而可以基于目标声源的成像频率进行声学成像,其成像效果更佳。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本申请实施例提供的声学成像频率确定方法的一流程示意图;图2为本申请实施例示例的一种频谱特征图;图3为本申请实施例示例的一种声学成像图;图4位本申请实施例提供的声学成像频率确定装置的结构示意图;图5为本申请实施例提供的声学成像频率确定设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在介绍本申请方案之前,首先对声学成像的一些技术进行介绍。声学照相机利用数字麦克风阵列,将采集的声音以彩色等高线图谱(以下称为声场热力图)的方式可视化呈现在屏幕上,形成类似于热成像仪对物体温度的探测效果。声学照相机一般以固定的帧率实时展示视频画面和声场热力图。即展示当前最新的视频帧和最新的音频数据帧(音频数据每帧的时间固定,如8ms)计算得到的声场热力图。声学成像的关键在于视频画面与声场热力图叠本文档来自技高网...

【技术保护点】
1.一种声学成像频率确定方法,其特征在于,包括:/n对采集的音频数据进行快速傅里叶变换,得到频谱特征;/n基于所述频谱特征,确定各预设频点的声源能量值;/n基于各预设频点的声源能量值,确定用于表征目标声源能量下限的声源能量阈值;/n基于所述频谱特征及所述声源能量阈值,确定目标声源的初步成像频率范围。/n

【技术特征摘要】
1.一种声学成像频率确定方法,其特征在于,包括:
对采集的音频数据进行快速傅里叶变换,得到频谱特征;
基于所述频谱特征,确定各预设频点的声源能量值;
基于各预设频点的声源能量值,确定用于表征目标声源能量下限的声源能量阈值;
基于所述频谱特征及所述声源能量阈值,确定目标声源的初步成像频率范围。


2.根据权利要求1所述的方法,其特征在于,所述采集的音频数据包括多路音频数据;
所述基于所述频谱特征,确定各预设频点的声源能量值,包括:
基于各路音频数据分别对应的频谱特征,计算每一预设频点上能量幅值的累加值,得到每一预设频点的声源能量值。


3.根据权利要求1所述的方法,其特征在于,所述基于各预设频点的声源能量值,确定用于表征目标声源能量下限的声源能量阈值,包括:
对各预设频点的声源能量值进行平均处理,结果作为用于表征目标声源能量下限的声源能量阈值;
或,
对各预设频点的声源能量值进行加权平均处理,结果作为用于表征目标声源能量下限的声源能量阈值,其中各频点的加权系数为预设值。


4.根据权利要求1所述的方法,其特征在于,所述基于所述频谱特征及所述声源能量阈值,确定目标声源的初步成像频率范围,包括:
基于所述频谱特征,确定声源能量超过所述声源能量阈值的至少一个待定频段;
基于所述至少一个待定频段,确定目标声源的初步成像频率范围。


5.根据权利要求4所述的方法,其特征在于,所述基于所述至少一个待定频段,确定目标声源的初步成像频率范围,包括:
根据各所述待定频段对应的声源能量极大值,选取声源能量极大值最大的前N个待定频段,作为所述目标声源的初步成像频率范围。


6.根据权利要求1所述的方法,其特征在于,还包括:
对所述目标声源的各初步成像频率范围进行有效性的标定,所述有效性用于表示初步成像频率范围是否为目标声源的有效成像频率范围。


7.根据权利要求6所述的方法,其特征在于,还包括:
利用标定为有效的初步成像频率...

【专利技术属性】
技术研发人员:李俊万杉杉黄晴媛任颖
申请(专利权)人:浙江讯飞智能科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1