基于音频场景下的音频原始数据处理方法及装置制造方法及图纸

技术编号:29082859 阅读:14 留言:0更新日期:2021-06-30 09:44
本发明专利技术属于大数据技术领域,本发明专利技术提供了一种基于音频场景下的音频原始数据处理方法及装置,基于音频场景下的音频原始数据处理方法包括:获取目标音频场景下的音频原始数据;根据所述音频原始数据、预生成的机器学习模型以及预先创建的音频场景库处理所述音频原始数据。本发明专利技术解决了实时音频应用场景下缺少质量反馈机制,默认参数调优无法广泛适应现有应用场景的情况,可广泛应用在实时音视频多场景情况下,形成正向质量反馈机制,且不影响现有音频系统使用,具备快速推广的条件。具备快速推广的条件。具备快速推广的条件。

【技术实现步骤摘要】
基于音频场景下的音频原始数据处理方法及装置


[0001]本专利技术属于大数据
,具体涉及一种基于音频场景下的音频原始数据处理方法及装置。

技术介绍

[0002]现有技术中,音频会话场景下的音频质量评价主要从三个维度进行,即噪声抑制、回声消除以及人声增益,此三类评价一般采用人工MOS主观评价打分来评判音频质量,但这种评判方式存在主观风险,且耗时久,反馈机制冗长,不利于线上音频会话质量即使改善,如何能够建立正向反馈机制,实时对音频相关参数进行调整控制,成为提升音频质量的关键。

技术实现思路

[0003]本专利技术属于大数据
,针对现有技术中的问题,本专利技术解决了实时音频应用场景下缺少质量反馈机制,默认参数调优无法广泛适应现有应用场景的情况,可广泛应用在实时音视频多场景情况下,形成正向质量反馈机制,且不影响现有音频系统使用,具备快速推广的条件。
[0004]为解决上述技术问题,本专利技术提供以下技术方案:
[0005]第一方面,本专利技术提供一种基于音频场景下的音频原始数据处理方法,包括:
[0006]获取目标音频场景下的音频原始数据;
[0007]根据所述音频原始数据、预生成的机器学习模型以及预先创建的音频场景库处理所述音频原始数据。
[0008]一实施例中,生成所述机器学习模型的步骤包括:
[0009]获取多个音频场景下的音频原始数据;
[0010]提取所述多个音频场景下的音频原始数据的特征数据;
[0011]根据所述特征数据以及预先设定的约束条件对所述机器学习模型的初始模型进行训练,以生成所述机器学习模型。
[0012]一实施例中,创建所述音频场景库的步骤包括:
[0013]建立多个音频场景下的音频原始数据的特征数据与其对对应的音频场景之间的映射关系,以创建所述音频场景库。
[0014]一实施例中,所述根据所述特征数据以及预先设定的约束条件对所述机器学习模型的初始模型进行训练,以生成所述机器学习模型,包括:
[0015]将多个特征数据输入至算法池,以生成多个初始模型;
[0016]利用所述算法池中的多个算法,根据所述特征数据以及所述约束条件对多个初始模型进行训练,以生成多个机器学习模型。
[0017]一实施例中,所述根据所述音频原始数据、预生成的机器学习模型以及预先创建的音频场景库处理所述音频原始数据,包括:
[0018]提取所述目标音频场景下的音频原始数据的特征数据;
[0019]根据所述特征数据在所述音频场景库中匹配其对应的音频场景;
[0020]根据所述音频场景确定所述目标音频场景对应的音频调优参数;
[0021]将所述特征数据以及所述音频调优参数输入至所述机器学习模型,以处理所述音频原始数据。
[0022]第二方面,本专利技术提供一种基于音频场景下的音频原始数据处理装置,包括:
[0023]数据获取模块,用于获取目标音频场景下的音频原始数据;
[0024]音频原始数据处理模块,用于根据所述音频原始数据、预生成的机器学习模型以及预先创建的音频场景库处理所述音频原始数据。
[0025]一实施例中,基于音频场景下的音频原始数据处理装置还包括:学习模型生成模块,用于生成所述机器学习模型,所述学习模型生成模块包括:
[0026]数据获取单元,用于获取多个音频场景下的音频原始数据;
[0027]特征数据提取第一单元,用于提取所述多个音频场景下的音频原始数据的特征数据;
[0028]学习模型生成单元,用于根据所述特征数据以及预先设定的约束条件对所述机器学习模型的初始模型进行训练,以生成所述机器学习模型。
[0029]一实施例中,基于音频场景下的音频原始数据处理装置还包括:场景库生成模块,用于创建所述音频场景库;
[0030]所述音频场景库具体用于建立多个音频场景下的音频原始数据的特征数据与其对对应的音频场景之间的映射关系,以创建所述音频场景库。
[0031]一实施例中,所述学习模型生成单元包括:
[0032]多初始模型生成单元,用于将多个特征数据输入至算法池,以生成多个初始模型;
[0033]多学习模型生成单元,用于利用所述算法池中的多个算法,根据所述特征数据以及所述约束条件对多个初始模型进行训练,以生成多个机器学习模型。
[0034]一实施例中,所述音频原始数据处理模块包括:
[0035]特征数据提取第二单元,用于提取所述目标音频场景下的音频原始数据的特征数据;
[0036]音频场景匹配单元,用于根据所述特征数据在所述音频场景库中匹配其对应的音频场景;
[0037]音频调优参数确定单元,用于根据所述音频场景确定所述目标音频场景对应的音频调优参数;
[0038]音频原始数据处理单元,用于将所述特征数据以及所述音频调优参数输入至所述机器学习模型,以处理所述音频原始数据。
[0039]第三方面,本专利技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现基于音频场景下的音频原始数据处理方法的步骤。
[0040]第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现基于音频场景下的音频原始数据处理方法的步骤。
[0041]从上述描述可知,本专利技术实施例提供的基于音频场景下的音频原始数据处理方法
及装置,首先获取目标音频场景下的音频原始数据;然后根据所述音频原始数据、预生成的机器学习模型以及预先创建的音频场景库处理所述音频原始数据。本专利技术在实时音频应用场景下能够对音频原始数据处理有较好效果,其有益效果具体如下:
[0042]1、解决了实时音频应用场景下缺少质量反馈机制,默认参数调优无法广泛适应现有应用场景的情况,可广泛应用在实时音视频多场景情况下,形成正向质量反馈机制,且不影响现有音频系统使用,具备快速推广的条件;
[0043]2、于已有成熟技术组合,如机器学习算法、3A技术,具备快速实现的条件。
附图说明
[0044]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1为本专利技术的实施例中基于音频场景下的音频原始数据处理方法流程示意图一;
[0046]图2为本专利技术的实施例中基于音频场景下的音频原始数据处理方法流程示意图二;
[0047]图3为本专利技术的实施例中步骤200的流程示意图;
[0048]图4为本专利技术的实施例中基于音频场景下的音频原始数据处理方法流程示意图三;
[0049]图5为本专利技术的实施例中步骤400的流程示意图;
[0050]图6为本专利技术的实施例中步骤303本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于音频场景下的音频原始数据处理方法,其特征在于,包括:获取目标音频场景下的音频原始数据;根据所述音频原始数据、预生成的机器学习模型以及预先创建的音频场景库处理所述音频原始数据。2.根据权利要求1所述的基于音频场景下的音频原始数据处理方法,其特征在于,创建所述机器学习模型的步骤包括:获取多个音频场景下的音频原始数据;提取所述多个音频场景下的音频原始数据的特征数据;根据所述特征数据以及预先设定的约束条件对所述机器学习模型的初始模型进行训练,以生成所述机器学习模型。3.根据权利要求2所述的基于音频场景下的音频原始数据处理方法,其特征在于,预先创建所述音频场景库的步骤包括:建立多个音频场景下的音频原始数据的特征数据与其对对应的音频场景之间的映射关系,以创建所述音频场景库。4.根据权利要求2所述的基于音频场景下的音频原始数据处理方法,其特征在于,所述根据所述特征数据以及预先设定的约束条件对所述机器学习模型的初始模型进行训练,以生成所述机器学习模型,包括:将多个特征数据输入至算法池,以生成多个初始模型;利用所述算法池中的多个算法,根据所述特征数据以及所述约束条件对多个初始模型进行训练,以生成多个机器学习模型。5.根据权利要求4所述的基于音频场景下的音频原始数据处理方法,其特征在于,所述根据所述音频原始数据、预生成的机器学习模型以及预先创建的音频场景库处理所述音频原始数据,包括:提取所述目标音频场景下的音频原始数据的特征数据;根据所述特征数据在所述音频场景库中匹配其对应的音频场景;根据所述音频场景确定所述目标音频场景对应的音频调优参数;将所述特征数据以及所述音频调优参数输入至所述机器学习模型,以对所述音频原始数据进行人声增益、回声消除以及噪声抑制。6.一种基于音频场景下的音频原始数据处理装置,其特征在于,包括:数据获取模块,用于获取目标音频场景下的音频原始数据;音频原始数据处理模块,用于根据所述音频原始数据、预生成的机器学习模型以及预先创建的音频场景库处理所述音频原始数据。7.根据权利要求6所述的基于音频场景下的音频原始数据处理...

【专利技术属性】
技术研发人员:王亚新曾德林江文乐阮明慧
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1