一种音频修复方法、设备及可读存储介质技术

技术编号:21895727 阅读:33 留言:0更新日期:2019-08-17 16:01
本申请公开了一种音频修复方法、设备及可读存储介质,其中方法包括:将多个音频帧依次输入到缓存模块中,所述缓存模块由多个处理单元顺序组成,位于所述多个处理单元的中心位置的处理单元为中心处理单元;将所述中心处理单元中所包含的至少一个音频帧作为目标帧;根据所述缓存模块中的多个音频帧的音频特征,检测所述目标帧中表现为短时高能量脉冲的噪声点;修复所述目标帧,所述修复用于去除所述目标帧中的噪声点。本申请先将多个音频帧连续的输入到缓存模块中之后,依次对位于缓存模块的中心位置的音频帧中表现为短时高能量脉冲的噪声点进行检测和修复,于是本申请提供了一种高效、准确和快速的音频修复方法。

An Audio Repair Method, Equipment and Readable Storage Media

【技术实现步骤摘要】
一种音频修复方法、设备及可读存储介质
本申请涉及信号处理领域,尤其涉及一种音频修复方法、设备及可读存储介质。
技术介绍
由于干扰信号的影响,音频中时常会产生出一种听感上为“咔哒”声的噪声,这种噪声实际上是一种存在于音频中的短时高能量脉冲,有着能量大和持续时间小的特点。现目前针对音频中的这种表现为高能量短时脉冲的噪声,还没有比较好的检测以及修复的方法。
技术实现思路
本申请实施例提供一种音频修复方法,可以检测并修复音频中表现为短时高能量脉冲的噪声点。第一方面,本申请实施例提供了一种音频修复方法,该方法包括:将多个音频帧依次输入到缓存模块中,所述缓存模块由多个处理单元顺序组成,位于所述多个处理单元的中心位置的处理单元为中心处理单元;将所述中心处理单元中所包含的至少一个音频帧作为目标帧;根据所述缓存模块中的多个音频帧的音频特征,检测所述目标帧中表现为短时高能量脉冲的噪声点;修复所述目标帧,所述修复用于去除所述目标帧中的噪声点。第二方面,本申请实施例提供了一种音频修复设备,该音频修复设备包括用于执行上述第一方面的音频修复方法的单元,该音频修复设备包括:输入单元,用于将多个音频帧依次输入到缓存模块中,所述缓存模块由多个处理单元顺序组成,位于所述多个处理单元的中心位置的处理单元为中心处理单元;获取单元,用于将所述中心处理单元中所包含的至少一个音频帧作为目标帧;检测单元,用于根据所述缓存模块中的多个音频帧的音频特征,检测所述目标帧中表现为短时高能量脉冲的噪声点;修复单元,用于修复所述目标帧,所述修复用于去除所述目标帧中的噪声点。第三方面,本申请实施例提供了一种音频修复设备,包括处理器、通信接口、输入设备、输出设备和存储器,所述处理器、通信接口、输出设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,用以执行如第一方面所述的方法第四方面,本申请实施例提供了一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行,用以执行如第一方面所述的方法。本申请将多个音频帧依次输入到缓存模块中,然后把缓存模块中的中心处理单元中的音频帧作为目标帧,并根据缓存模块中的多个音频帧的音频特征,来确定目标帧中的噪声点,最后修复该目标帧。可见,本申请至少包含以下几个专利技术点,首先本申请通过将多个音频帧连续的输入到缓存模块中,并依次对缓存模块中的中心处理单元中的音频帧进行处理,来毫不遗漏且准确的检测和修复到每个音频帧中的噪声点,其次本申请通过将目标帧的音频特征,与目标帧相邻的音频帧的音频特征进行比较,可以准确的检测出目标帧中的噪声点,最后本申请除了可以检测出上述噪声点,还可以去除上述噪声点。因此,本申请可以自动地对大量音频信号进行修复,提供了一种高效、准确以及快速的音频修复方法。附图说明为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。图1是本申请实施例提供的一种音频修复方法的应用场景示意图;图2是本申请实施例提供的一种音频修复方法的示意流程图;图3是本申请另一实施例提供的一种音频修复方法的示意流程图;图4是本申请实施例提供的一种将多个音频帧输入缓存模块的示意图;图5是本申请实施例提供的一种缓存重定位和修复的示意图;图6是本申请实施例提供的一种音频修复设备的示意性框图;图7是本申请实施例提供的一种音频修复设备的结构性框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请主要应用于音频修复设备,该音频修复设备可以是传统音频修复设备或者本申请第三实施例和第四实施例所描述的音频修复设备,本申请对此不做限制。当音频修复设备发送数据的时候,按照预设格式进行对数据的特性进行记录并传送,其中,数据的特性包括时间、地点、类型等。音频信号因为受到噪声的干扰,而产生一种表现为短时高能量脉冲的噪声点,使得音频信号在播放的时候,产生一种听感上类似于“咔哒”的噪声。为了解决这个问题,本申请提出了一种用于检测并修复音频信号中噪声点的方法。为了能够更好地理解本专利技术实施例,下面将结合图1,对应用本专利技术实施例的方法进行介绍,本专利技术实施例可以应用于音频修复设备对音频信号进行检测和修复的场景中。请参见图1,音频修复设备(例如图中的手机)通过麦克风录音获得音频信号,或者从互联网接收到音频信号,然后对音频信号中表现为短时高能量脉冲的噪声点进行检测和修复。如图1所示,虚线圈出了未经处理的音频信号中的噪声点,该噪声点表现为短时高能量脉冲,在该音频信号经过音频修复设备的处理之后,虚线所圈出的噪声点被很好的修复了。具体的,本音频修复方法可以大致分为五个阶段来执行,包括信号输入,缓存重定位,噪声点检测,噪声点修复,以及信号输出。接下来本申请对该五个阶段依次进行介绍。本申请首先对获得的任意格式的音频信号进行分帧,得到多个音频帧,然后将该多个音频帧依次且连续的输入到缓存模块中。缓存模块如图4所示,该缓存模块由5个处理单元顺序连接而成,位于首位的处理单元为头部处理单元,而位于该5个处理单元的中心位置的信号处理单位为中心处理单元,并且每个处理单元中可容纳两个音频帧,音频帧由缓存模块的头部处理单元输入,按照处理单元连接的顺序,传输到其他处理单元中。一般来说,缓存单元可以包含三个及三个以上任意奇数个的处理单元,而且缓存模块中的处理单元的长度可以被设置为任意长度值,一般来说,可以设置为至少两个音频帧以上的长度。例如当处理单元的长度为两个音频帧的长度的时候,在对音频帧处理的过程中相邻音频帧之间有50%的信号重叠,从而避免了截断效应,使得信号处理的结果更加平滑。在音频帧输入到缓存模块,并每个处理单元都充满了音频帧之后,对缓存模块中的多个音频帧进行缓存重定位,即以音频帧中为噪声点的可能性最大的点为中心,重新获取需要进行检测的音频信号段。具体的,如图5所示,将中心处理单元中的音频帧作为目标帧,确定目标帧的峰值点(幅度值的绝对值为最大值的点),并基于该峰值点在缓存模块中获取长度为4个处理单元的音频信号段,最后将该音频信号段重新划分为多段区间,该多个区间包括第一处理区间、第二处理区间,以及位于第一处理区间和第二处理区间之间的中间处理区间,中间处理区间包括第一子区间、第二子区间,以及位于第一子区间和第二子区间的之间的中心子区间。需要说明的是,由于本申请用于修复的噪声点表现为短时高能量脉冲,于是噪声点最可能为音频帧中的峰值点,且音频信号分帧之后得到帧信号的长度已经很短了,一个音频帧中存在两个噪声点的可能性极小,因此本申请只需要检测是否为噪声点即可。提取上述音频信号段中的多段区间的音频特征,包括括峰值、信号能量、平均功率、局部峰值占比、自相关系数的滚降速率、声强和峰值持续时间中的至少一种。然后根据该多段区间的音频特征,判断目标帧的峰值点是否为噪声点。在确定出目标帧中的峰值点为噪声点之后,对该目标帧进行修复。修本文档来自技高网...

【技术保护点】
1.一种音频修复方法,其特征在于,包括:将多个音频帧依次输入到缓存模块中,所述缓存模块由多个处理单元顺序组成,位于所述多个处理单元的中心位置的处理单元为中心处理单元;将所述中心处理单元中所包含的至少一个音频帧作为目标帧;根据所述缓存模块中的多个音频帧的音频特征,检测所述目标帧中表现为短时高能量脉冲的噪声点;修复所述目标帧,所述修复用于去除所述目标帧中的噪声点。

【技术特征摘要】
1.一种音频修复方法,其特征在于,包括:将多个音频帧依次输入到缓存模块中,所述缓存模块由多个处理单元顺序组成,位于所述多个处理单元的中心位置的处理单元为中心处理单元;将所述中心处理单元中所包含的至少一个音频帧作为目标帧;根据所述缓存模块中的多个音频帧的音频特征,检测所述目标帧中表现为短时高能量脉冲的噪声点;修复所述目标帧,所述修复用于去除所述目标帧中的噪声点。2.根据权利要求1所述的方法,其特征在于,所述根据所述缓存模块中的多个音频帧的音频特征,检测所述目标帧中表现为短时高能量脉冲的噪声点,包括:确定所述目标帧的峰值点;以所述峰值点为中心,在所述缓存模块中获取预设长度的音频信号段;将所述音频信号段划分为多段区间,包括第一处理区间、第二处理区间,以及位于所述第一处理区间和所述第二处理区间之间的中间处理区间,所述中间处理区间包括第一子区间、第二子区间,以及位于所述第一子区间和所述第二子区间的之间的中心子区间;分别提取所述目标帧和所述多段区间的音频特征,所述音频特征包括峰值、信号能量、平均功率、局部峰值占比、自相关系数的滚降速率、声强和峰值持续时间中的至少一种;根据所述目标帧和所述多段区间的音频特征在所述目标帧中确定所述噪声点。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标帧和所述多段区间的音频特征在所述目标帧中确定所述噪声点,包括:判断所述目标帧的峰值点的幅度值是否同时大于所述中心子区间的峰值点的幅度值以及所述中间处理区间的峰值点的幅度值;且,判断所述目标帧的峰值点的幅度值是否同时大于所述第一子区间的峰值点的幅度值和所述第二子区间的峰值点的幅度值,且大于的部分超过第一阈值;且,判断所述中间处理区间的信号能量是否大于第二阈值;且,判断所述中间处理区间的平均功率与所述音频信号段的平均功率的比值是否大于第三阈值;且,判断所述目标帧的峰值点的幅度值与所述音频信号段的峰值点的总幅度值的比值是否大于第四阈值;且,判断所述音频信号段的自相关系数的滚降速率是否大于第四阈值;且,判断所述中心处理区间的声强是否大于所述第一处理区间的声强和...

【专利技术属性】
技术研发人员:徐东
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1