噪声数据获取方法、装置及存储介质制造方法及图纸

技术编号:24097449 阅读:43 留言:0更新日期:2020-05-09 11:06
本申请涉及一种噪声数据获取方法、装置及存储介质,属于计算机技术领域,该方法包括:采集音频数据;确定所述音频数据是否包括目标音频数据,所述目标音频数据是除噪声数据之外的音频数据;在所述音频数据未包括所述目标音频数据时确定所述音频数据为所述噪声数据;可以解决人工采集噪声数据的效率较低的问题;由于可以实现噪声数据的自动采集,因此,可以提高噪声数据的采集效率。

Noise data acquisition method, device and storage medium

【技术实现步骤摘要】
噪声数据获取方法、装置及存储介质
本申请涉及一种噪声数据获取方法、装置及存储介质,属于计算机

技术介绍
在通话场景中保证声音的清晰度才能保证通话有效进行。比如:在视频会议场景、语音通话场景等。若通话场景存在噪声,会影响语音的清晰度,降低通话效果。因此,噪声抑制在通话场景中的作用尤为重要。随着深度学习的发展,基于深度学习的噪声抑制算法广泛使用,例如深度学习噪声抑制(LearningNoiseSuppression,RNNoise)等。在使用基于深度学习的噪声抑制算法之前,需要使用大量的噪声数据来训练噪声抑制网络模型。噪声数据的数量越多,对提升噪声抑制网络模型的模型性能越有利。目前常用的噪声数据的获取方法包括:在各种不同场景人工采集噪声数据。由于噪声数据的采集数量非常大,通过人工采集的效率较低。
技术实现思路
本申请提供了一种噪声数据获取方法、装置及存储介质,可以解决人工采集噪声数据的效率较低的问题。本申请提供如下技术方案:第一方面,提供了一种噪声数据获取方法,所述方法包括:采集音频数据;确定所述音频数据是否包括目标音频数据,所述目标音频数据是除噪声数据之外的音频数据;在所述音频数据未包括所述目标音频数据时确定所述音频数据为所述噪声数据。可选地,所述确定所述音频数据是否包括目标音频数据,包括:检测所述音频数据是否包括人声;和/或,检测所述音频数据是否包括音乐。可选地,所述方法还包括:确定所述音频数据的最大能量值是否大于或等于能量阈值;在所述最大能量值大于或等于能量阈值时触发执行所述确定所述音频数据是否包括目标音频数据的步骤。可选地,所述噪声数据用于训练目标场景中的噪声抑制模型,所述方法还包括:确定当前是否处于所述目标场景,在当前处于所述目标场景时触发执行所述采集音频数据的步骤。可选地,所述在所述音频数据未包括所述目标音频数据时确定所述音频数据为所述噪声数据之后,还包括:将所述噪声数据发送至服务器,以供所述服务器将所述噪声数据与已存储噪声数据进行匹配;在所述噪声数据与所述已存储噪声数据之间的相似度值小于或等于相似度阈值时存储所述噪声数据。第二方面,提供了一种噪声数据获取方法,所述方法包括:接收客户端发送的噪声数据;所述噪声数据是所述客户端采集到音频数据之后,在确定出所述音频数据未包括目标音频数据时发送的;所述目标音频数据是除噪声数据之外的音频数据;将所述噪声数据与已存储噪声数据进行匹配;在所述噪声数据与所述已存储噪声数据之间的相似度值小于或等于相似度阈值时存储所述噪声数据。可选地,所述将所述噪声数据与已存储噪声数据进行匹配,包括:确定所述噪声数据的哈希值;将所述噪声数据的哈希值与所述已存储噪声数据的哈希值进行比较。可选地,所述确定所述噪声数据的哈希值,包括:对每帧噪声数据进行时频转换,得到每帧噪声数据对应的频域数据;对所述每帧噪声数据对应的频域数据所构成的矩阵进行离散余弦变换,得到系数矩阵;对于所述系数矩阵中m×n的二维矩阵,对所述二维矩阵进行二值化处理,得到所述噪声数据的哈希值,所述噪声数据的哈希值为二值化处理后的二维矩阵,所述m和所述n均为正整数。可选地,所述将所述噪声数据的哈希值与所述已存储噪声数据的哈希值进行比较,包括:计算噪声数据的哈希值与所述已存储噪声数据的哈希值之间的海明距离,得到所述相似度值。第三方面,提供了一种噪声数据获取装置,所述装置包括:音频采集模块,用于采集音频数据;音频检测模块,用于确定所述音频数据是否包括目标音频数据,所述目标音频数据是除噪声数据之外的音频数据;音频确定模块,用于在所述音频数据未包括所述目标音频数据时确定所述音频数据为所述噪声数据。第四方面,提供了一种噪声数据获取装置,所述装置包括:数据接收模块,用于接收客户端发送的噪声数据;所述噪声数据是所述客户端采集到音频数据之后,在确定出所述音频数据未包括目标音频数据时发送的;,所述目标音频数据是除噪声数据之外的音频数据;噪声匹配模块,用于将所述噪声数据与已存储噪声数据进行匹配;噪声存储模块,用于在所述噪声数据与所述已存储噪声数据之间的相似度值小于或等于相似度阈值时存储所述噪声数据。第五方面,提供一种噪声数据获取装置,所述装置包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现第一方面所述的噪声数据获取方法;或者,实现第二方面所述的噪声数据获取方法。第六方面,提供一种计算机可读存储介质,所述存储介质中存储有程序,所述程序由所述处理器加载并执行以实现第一方面所述的噪声数据获取方法;或者,实现第二方面所述的噪声数据获取方法。本申请的有益效果在于:通过采集音频数据;确定音频数据是否包括目标音频数据,目标音频数据是除噪声数据之外的音频数据;在音频数据未包括目标音频数据时确定音频数据为噪声数据;可以解决人工采集噪声数据的效率较低的问题;由于可以实现噪声数据的自动采集,因此,可以提高噪声数据的采集效率。上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。附图说明图1是本申请一个实施例提供的噪声数据获取系统的结构示意图;图2是本申请一个实施例提供的噪声数据获取方法的流程图;图3是本申请另一个实施例提供的噪声数据获取方法的流程图;图4是本申请一个实施例提供的噪声数据对应的频域数据的二维矩阵示意图;图5是本申请另一个实施例提供的噪声数据获取方法的流程图;图6是本申请一个实施例提供的噪声数据获取装置的框图;图7是本申请一个实施例提供的噪声数据获取装置的框图;图8是本申请一个实施例提供的噪声数据获取装置的框图。具体实施方式下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。首先,对本申请涉及的若干名词进行解释。脉冲编码调制(PulseCodeModulation,PCM):是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。离散余弦变换(DiscreteCosineTransform,DCT):主要用于对数据或图像进行压缩,能够将空域的信号转换到频域上,具有良好的去相关性的性能。海明距离(Hammingdistance):在信息编码中,两个合法代码对应位上编码不同的位数称为码距,又称海明距离。举例如下:10101和00110从第一位开始依次有第一位、第四位、第五位不同,则海明距离为3。本文档来自技高网...

【技术保护点】
1.一种噪声数据获取方法,其特征在于,所述方法包括:/n采集音频数据;/n确定所述音频数据是否包括目标音频数据,所述目标音频数据是除噪声数据之外的音频数据;/n在所述音频数据未包括所述目标音频数据时确定所述音频数据为所述噪声数据。/n

【技术特征摘要】
1.一种噪声数据获取方法,其特征在于,所述方法包括:
采集音频数据;
确定所述音频数据是否包括目标音频数据,所述目标音频数据是除噪声数据之外的音频数据;
在所述音频数据未包括所述目标音频数据时确定所述音频数据为所述噪声数据。


2.根据权利要求1所述的方法,其特征在于,所述确定所述音频数据是否包括目标音频数据,包括:
检测所述音频数据是否包括人声;和/或,
检测所述音频数据是否包括音乐。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述音频数据的最大能量值是否大于或等于能量阈值;
在所述最大能量值大于或等于能量阈值时触发执行所述确定所述音频数据是否包括目标音频数据的步骤。


4.根据权利要求1至3任一所述的方法,其特征在于,所述噪声数据用于训练目标场景中的噪声抑制模型,所述方法还包括:
确定当前是否处于所述目标场景,
在当前处于所述目标场景时触发执行所述采集音频数据的步骤。


5.根据权利要求1至3任一所述的方法,其特征在于,所述在所述音频数据未包括所述目标音频数据时确定所述音频数据为所述噪声数据之后,还包括:
将所述噪声数据发送至服务器,以供所述服务器将所述噪声数据与已存储噪声数据进行匹配;在所述噪声数据与所述已存储噪声数据之间的相似度值小于或等于相似度阈值时存储所述噪声数据。


6.一种噪声数据获取方法,其特征在于,所述方法包括:
接收客户端发送的噪声数据;所述噪声数据是所述客户端采集到音频数据之后,在确定出所述音频数据未包括目标音频数据时发送的;所述目标音频数据是除噪声数据之外的音频数据;
将所述噪声数据与已存储噪声数据进行匹配;
在所述噪声数据与所述已存储噪声数据之间的相似度值小于或等于相似度阈值时存储所述噪声数据。


7.根据权利要求6所述的方法,其特征在于,所述将所述噪声数据与已存储噪声数据进行匹配,包括:
确定所述噪声数据的哈希值;
将所述噪声数据的哈希值与所述已存储噪声数据的哈希值进行比较。

...

【专利技术属性】
技术研发人员:王展胡小鹏顾振华
申请(专利权)人:苏州科达科技股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1