一种用于野外观测的音频自动分析方法技术

技术编号:37334721 阅读:9 留言:0更新日期:2023-04-21 23:13
本发明专利技术涉及野外音频分析技术领域,具体地说,涉及一种用于野外观测的音频自动分析方法。其包括以下步骤:对野外环境中的声音进行捕捉、处理终端对接收的声音数据进行信号模拟,并将模拟完成的信号传输到带通滤波电路中、对四个频段的声音进行快速傅里叶变换和梅尔尺度滤波,以形成梅尔图谱、将生成的梅尔图谱接入分路神经网络结构,分离出音频分路图谱,反推声音分路、通过声音分路的反推,获得每个声音音频。本发明专利技术中通过将不同分贝的声音进行分别提取,使采集的声音被分离开,同时采用此种方式也使重叠在一起的声音分离开,以便于后期梅尔图谱的生成,使采集的声音中较小的声音也可以分析提取出来,并将不同分贝的声音提取出来处理。取出来处理。取出来处理。

【技术实现步骤摘要】
一种用于野外观测的音频自动分析方法


[0001]本专利技术涉及野外音频分析
,具体地说,涉及一种用于野外观测的音频自动分析方法。

技术介绍

[0002]在进行野外观测时,会对野外的声音进行观测,而在进行野外观测时,会使用装置对野外的声音进行捕捉,并在音频录制完成后,对音频中的声音进行处理,以获取野外的不同声音。
[0003]目前在对野外的声音进行处理时,会使用软件和硬件自动分析声音信号,并根据其声源,进行自动分路的技术,通常用于研究多种同时发声的动物的行为和声音,也可用于研究环境中不同的声音。
[0004]从20世纪50年代开始,科学家就开始使用计算机分析声音信号并将其分类,随着计算机技术的发展,这种技术也得到了改进和提升;目前用于野外观测的音频自动分路技术已广泛应用于生物学、生态学、气象学和其他多个领域,它可以帮助科学家研究动物的声音是如何产生的,以及它们之间的交流方式,此外,这种技术还可以用于监测环境中的声音变化,帮助研究人员了解这些变化的原因。
[0005]但野外的声音复杂,且细微的声音很难被提取出来,且目前只能对一种声音进行分类,无法对声音进行处理,使当遇到声音很复杂的背景时,很难将声音提取出来,同时当遇到多个声音重叠时,也很难对重叠的声音进行提取,如此便给录制的野外声音的提取增加难度。

技术实现思路

[0006]本专利技术的目的在于提供一种用于野外观测的音频自动分析方法,以解决上述
技术介绍
中提出的问题。
[0007]为实现上述目的,本专利技术提供一种用于野外观测的音频自动分析方法,包括以下步骤:S1、对野外环境中的声音进行捕捉,并将捕捉到的声音进行处理终端传输;S2、处理终端对接收的声音数据进行信号模拟,并将模拟完成的信号传输到带通滤波电路中,使带通滤波电路将采集的声音分为四个频段;S3、对四个频段的声音进行快速傅里叶变换和梅尔尺度滤波,以形成梅尔图谱,对形成梅尔图谱进行矩阵化,形成数字信息;S4、将生成的梅尔图谱接入分路神经网络结构,分离出音频分路图谱,反推声音分路;S5、通过声音分路的反推,获得每个声音音频。
[0008]作为本技术方案的进一步改进,所述S1中,对野外环境进行捕捉时,对长时间且重复的声音进行屏蔽,并在出现其他的声音时,对此时的声音进行捕捉。
[0009]作为本技术方案的进一步改进,所述S2中,将采集的声音分为四个频段的步骤如下:S2.1、对声音进行分离,获取声音中不同分贝音量;S2.2、对分贝大的声音进行提取和保存,并在提取后,将提取的声音和采集的声音进行对比,将提取的声音从采集的声音中删除掉;S2.3、对处理过的声音重复S2.2的操作,如此重复下去,获取不同分贝的声音片段;S2.4、将获取的不同分贝的声音进行分类,以形成四个频段。
[0010]作为本技术方案的进一步改进,在进行声音的分类时,将声音分为:低频声音、中频声音、高频声音和超高频声音。
[0011]作为本技术方案的进一步改进,所述S3中,对四个频段的声音进行快速傅里叶变换和梅尔尺度滤波时,将四个频段单独进行快速傅里叶变换和梅尔尺度滤波,且快速傅里叶变换和梅尔尺度滤波后的数据组合形成梅尔图谱。
[0012]作为本技术方案的进一步改进,在所述S2.4中,将获取的不同分贝的声音进行分类之前,对提取出来的不同分贝的声音进行标号,并在标号完毕后,复制并存储,且在对四个频段的声音进行快速傅里叶变换和梅尔尺度滤波时,对不同分贝的声音进行对应的标号显示。
[0013]作为本技术方案的进一步改进,所述S5中,在进行声音分路的反推的时候,根据不同分贝声音的标号进行声音对应的匹配,使在声音反推后,直接获取每个分贝声音。
[0014]作为本技术方案的进一步改进,在声音反推完成后,对不同分贝中声音的音色进行提取,并将相同音色的音频进行组合,形成一个完整时间内部的声音变换。
[0015]与现有技术相比,本专利技术的有益效果:1、该用于野外观测的音频自动分析方法中,通过将不同分贝的声音进行分别提取,使采集的声音被分离开,同时采用此种方式也使重叠在一起的声音分离开,以便于后期梅尔图谱的生成,使采集的声音中较小的声音也可以分析提取出来,并将不同分贝的声音提取出来处理,使系统可以对多种声音进行同时处理,提高对采集声音的处理速度。
[0016]2、该用于野外观测的音频自动分析方法中,通过对提取出来的不同分贝的声音进行标记,并在进行声音反推的时候,将对应的声音进行标号匹配,以此来方便声音在反推后再进行匹配的麻烦,加快音频处理的速度。
附图说明
[0017]图1为本专利技术实施例1的整体步骤示意框图;图2为本专利技术实施例1的S2的具体流程示意框图。
具体实施方式
[0018]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0019]实施例1:
[0020]野外的声音复杂,且细微的声音很难被提取出来,且目前只能对一种声音进行分类,无法对声音进行处理,使当遇到声音很复杂的背景时,很难将声音提取出来,同时当遇到多个声音重叠时,也很难对重叠的声音进行提取,如此便给录制的野外声音的提取增加难度。
[0021]为了解决上述所描述的问题,本专利技术提供一种用于野外观测的音频自动分析方法,请参阅图1

图2,包括以下步骤:S1、对野外环境中的声音进行捕捉,并将捕捉到的声音进行处理终端传输;对野外环境进行捕捉时,对长时间且重复的声音进行屏蔽,并在出现其他的声音时,对此时的声音进行捕捉,如此会减少对重复声音的录制,做到声音的精准录制,同时也可以延长录音装置的工作时间。
[0022]S2、处理终端对接收的声音数据进行信号模拟,并将模拟完成的信号传输到带通滤波电路中,使带通滤波电路将采集的声音分为四个频段;将采集的声音分为四个频段的步骤如下:S2.1、对声音进行分离,获取声音中不同分贝音量;S2.2、对分贝大的声音进行提取和保存,并在提取后,将提取的声音和采集的声音进行对比,将提取的声音从采集的声音中删除掉;S2.3、对处理过的声音重复S2.2的操作,如此重复下去,获取不同分贝的声音片段;S2.4、将获取的不同分贝的声音进行分类,以形成四个频段;在进行声音的分类时,将声音分为:低频声音、中频声音、高频声音和超高频声音,分类时,将不同分贝的声音分离开,如此便于系统对声音的处理,提高声音处理的速度,同时将声音分开进行处理,可以降低系统计算声音时的计算压力,加快系统对声音的计算速度。
[0023]在所述S2.4中,将获取的不同分贝的声音进行分类之前,对提取出来的不同分贝的声音进行标号,并在标号完毕后,复制并存储,以便于后期的使用,同时也方便对不同声音的分类和查找。
[0024]S3、对四个频段的声音进行快速傅里叶变换和梅尔本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于野外观测的音频自动分析方法,其特征在于:包括以下步骤:S1、对野外环境中的声音进行捕捉,并将捕捉到的声音进行处理终端传输;S2、处理终端对接收的声音数据进行信号模拟,并将模拟完成的信号传输到带通滤波电路中,使带通滤波电路将采集的声音分为四个频段;S3、对四个频段的声音进行快速傅里叶变换和梅尔尺度滤波,以形成梅尔图谱,对形成梅尔图谱进行矩阵化,形成数字信息;S4、将生成的梅尔图谱接入分路神经网络结构,分离出音频分路图谱,反推声音分路;S5、通过声音分路的反推,获得每个声音音频。2.根据权利要求1所述的用于野外观测的音频自动分析方法,其特征在于:所述S1中,对野外环境进行捕捉时,对长时间且重复的声音进行屏蔽,并在出现其他的声音时,对此时的声音进行捕捉。3.根据权利要求1所述的用于野外观测的音频自动分析方法,其特征在于:所述S2中,将采集的声音分为四个频段的步骤如下:S2.1、对声音进行分离,获取声音中不同分贝音量;S2.2、对分贝大的声音进行提取和保存,并在提取后,将提取的声音和采集的声音进行对比,将提取的声音从采集的声音中删除掉;S2.3、对处理过的声音重复S2.2的操作,如此重复下去,获取不同分贝的声音片段;S2.4、...

【专利技术属性】
技术研发人员:雷佳琳滕兵
申请(专利权)人:百鸟数据科技北京有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1