音频数据存储方法和声音模型训练方法及装置制造方法及图纸

技术编号:38820257 阅读:13 留言:0更新日期:2023-09-15 19:59
本公开提出了一种音频数据存储方法和声音模型训练方法及装置,涉及数据处理技术领域,该方法包括:获取待存储的音频数据,音频数据包括至少一个通道音频数据;获取通道音频数据所属通道的分段规则,基于分段规则对通道音频数据进行分段,以获取分段音频数据;获取分段音频数据的存储维度,基于存储维度对分段音频数据进行存储。通过设定分段规则对音频数据进行分段和处理,提升后续音频数据的处理和利用的效率,减低数据处理的成本。减低数据处理的成本。减低数据处理的成本。

【技术实现步骤摘要】
音频数据存储方法和声音模型训练方法及装置


[0001]本公开涉及数据处理
,尤其涉及一种音频数据存储方法和声音模型训练方法及装置。

技术介绍

[0002]现有其它的音频编码格式,主要是以实时播放为主,以6通道音频数据为例,存储数据的排列方式是以6个通道的单个样本组合,然后形成多个组合。
[0003]在以声纹技术为基础的工业设备异常监测中,计算中心需要使用多个声音传感器的音频进行模型训练和逻辑判断。模型训练使用神经网络或者其它特征算法,此时需要根据设备情况,选取一定数量的采样点数。音频通道数根据传感器的数量而定,每个传感器是一个通道,如果继续使用传统编码方式,则会造成数据读取时间以及拼接数据时间的浪费。

技术实现思路

[0004]本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此,本公开的一个目的在于提出一种音频数据存储方法。
[0006]本公开的第二个目的在于提出一种声音模型训练方法。
[0007]本公开的第三个目的在于提出一种频数据存储装置。
[0008]本公开的第四个目的在于提出一种声音模型训练装置。
[0009]本公开的第五个目的在于提出一种电子设备。
[0010]本公开的第六个目的在于提出一种非瞬时计算机可读存储介质。
[0011]本公开的第七个目的在于提出一种计算机程序产品。
[0012]为达上述目的,本公开第一方面实施方式提出了一种音频数据存储方法,其特征在于,包括:获取待存储的音频数据,所述音频数据包括至少一个通道音频数据;获取所述通道音频数据所属通道的分段规则,基于所述分段规则对所述通道音频数据进行分段,以获取分段音频数据;获取所述分段音频数据的存储维度,基于所述存储维度对所述分段音频数据进行存储。
[0013]根据本公开的一个实施方式,所述获取所述分段音频数据的存储维度,包括:获取所述分段规则中的存储需求;响应于所述存储需求为按通道进行存储,确定所述存储维度为空间维度;响应于所述存储需求为按时间进行存储,确定所述存储维度为时间维度。
[0014]根据本公开的一个实施方式,基于所述存储维度对所述分段音频数据进行存储,包括:所述存储维度为所述空间维度,将所述分段音频数据按照所属通道存储在同一存储空间中。
[0015]根据本公开的一个实施方式,基于所述存储维度对所述分段音频数据进行存储,包括:所述存储维度为所述时间维度,获取预设时间间隔;将同一所述预设时间间隔内的所有分段音频数据,存储在同一存储空间中。
[0016]根据本公开的一个实施方式,所述方法还包括:将所述分段音频数据进行压缩,以
生成压缩数据;将所述压缩数据上传至云端服务器的存储空间中。
[0017]根据本公开的一个实施方式,所述分段规则包括需要截取的所述通道音频数据的截取位置、字节大小、区块名称、端序和注释。
[0018]为达上述目的,本公开第二方面实施例提出了一种声音模型训练方法,包括:获取待训练的音频数据,将所述待训练的音频数据按照如第一方面所述的音频数据存储方法进行处理,以获取训练样本;基于所述训练样本对声音模型进行训练。
[0019]为达上述目的,本公开第三方面实施例提出了一种频数据存储装置,其特征在于,包括:获取模块,用于获取待存储的音频数据,所述音频数据包括至少一个通道音频数据;分段模块,用于获取所述通道音频数据所属通道的分段规则,基于所述分段规则对所述通道音频数据进行分段,以获取分段音频数据;存储模块,用于获取所述分段音频数据的存储维度,基于所述存储维度对所述分段音频数据进行存储。
[0020]为达上述目的,本公开第四方面实施例提出了一种声音模型训练装置,其特征在于,包括:获取模块,用于获取待训练的音频数据,将所述待训练的音频数据按照第一方面所述的音频数据存储方法进行处理,以获取训练样本;训练模块,用于基于所述训练样本对声音模型进行训练。
[0021]为达上述目的,本公开第五方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现如本公开第一方面实施例所述的音频数据存储方法或者如第二方面实施例所述的声音模型训练方法。
[0022]为达上述目的,本公开第六方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于实现如本公开第一方面实施例所述的音频数据存储方法或者如第二方面实施例所述的声音模型训练方法。
[0023]为达上述目的,本公开第七方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时用于实现如本公开第一方面实施例所述的音频数据存储方法或者如第二方面实施例所述的声音模型训练方法。
[0024]通过设定分段规则对音频数据进行分段和处理,提升后续音频数据的处理和利用的效率,减低数据处理的成本。
附图说明
[0025]图1为本公开提出的一种音频数据存储方法的一种示例性实施方式的示意图;
[0026]图2为本公开提出的一种声音模型训练方法的一种示例性实施方式的示意图;
[0027]图3为本公开提出的一种音频数据存储装置的示意图;
[0028]图4为本公开提出的一种声音模型训练装置的示意图;
[0029]图5是本公开一个实施方式的一种电子设备的示意图。
具体实施方式
[0030]下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
[0031]图1为本公开提出的一种音频数据存储方法的一种示例性实施方式的示意图,如图1所示,该音频数据存储方法包括以下步骤:
[0032]S101,获取待存储的音频数据,音频数据包括至少一个通道音频数据。
[0033]本申请实施例的音频数据存储方法可应用于工业设备异常监测的场景中,本申请实施例的音频数据存储的执行主体可为本申请实施例的音频数据存储装置,该音频数据存储装置可以设置在电子设备上。
[0034]在本公开实施例中,音频数据通常包含为多个通道样本的组合,该通道的数量以实际的设计需要而定。
[0035]举例来说,以声纹技术为基础的工业设备异常监测中,计算中心需要使用多个声音传感器的音频进行模型训练和逻辑判断。模型训练使用神经网络或者其它特征算法,此时需要根据设备情况,选取一定数量的采样点数。音频通道数根据传感器的数量而定,每个传感器是一个通道。
[0036]S102,获取通道音频数据所属通道的分段规则,基于分段规则对通道音频数据进行分段,以获取分段音频数据。
[0037]分段规则为对音频数据进行截取和处理的规则。该分段规则可包括进行分段的位置、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频数据存储方法,其特征在于,包括:获取待存储的音频数据,所述音频数据包括至少一个通道音频数据;获取所述通道音频数据所属通道的分段规则,基于所述分段规则对所述通道音频数据进行分段,以获取分段音频数据;获取所述分段音频数据的存储维度,基于所述存储维度对所述分段音频数据进行存储。2.根据权利要求1所述的方法,其特征在于,所述获取所述分段音频数据的存储维度,包括:获取所述分段规则中的存储需求;响应于所述存储需求为按通道进行存储,确定所述存储维度为空间维度;响应于所述存储需求为按时间进行存储,确定所述存储维度为时间维度。3.根据权利要求2所述的方法,其特征在于,基于所述存储维度对所述分段音频数据进行存储,包括:所述存储维度为所述空间维度,将所述分段音频数据按照所属通道存储在同一存储空间中。4.根据权利要求2所述的方法,其特征在于,基于所述存储维度对所述分段音频数据进行存储,包括:所述存储维度为所述时间维度,获取预设时间间隔;将同一所述预设时间间隔内的所有分段音频数据,存储在同一存储空间中。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述分段音频数据进行压缩,以生成压缩数据;将所述压缩数据上传至云端服务器的存储空间中。6.根据权利要求1所述的方法,其特征在于,所述分段规则包括需要截取的所述通道音频数据的...

【专利技术属性】
技术研发人员:卢回忆刘豪睿刘加曹宏刘德广
申请(专利权)人:北京华控智加科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1