降噪处理方法、装置、终端及存储介质制造方法及图纸

技术编号:33992973 阅读:29 留言:0更新日期:2022-07-02 10:10
本公开是关于一种降噪处理方法、装置、终端及存储介质。该方法包括:获取待处理的第一音频信息;确定第一音频信息的待处理频谱特征;根据声学场景分类模型和待处理频谱特征,确定第一音频信息所属的声学场景类型;根据声学场景类型对第一音频信息进行降噪处理,得到降噪后的第二音频信息。该方法中,根据声学场景类型,采用不同的方式对第一音频信息进行降噪处理,从而准确、高效且简便的获得降噪后的降噪音频信息,无需用户了解过多的软件操作知识和声音领域的知识,即可实现很好地音频处理,进而实现很好地视频处理,提升了用户的使用体验。用体验。用体验。

【技术实现步骤摘要】
降噪处理方法、装置、终端及存储介质


[0001]本公开涉及神经网络
,尤其涉及一种降噪处理方法、装置、终端及存储介质。

技术介绍

[0002]相关技术中,在对视频中的音频进行降噪处理时,一般需要将待处理的视频导入专业的软件中,用户通过该专业的软件对视频中的音频进行手动降噪处理,这就需要用户具备专业的软件知识和声音领域的知识,才能实现降噪处理,用户体验较差。

技术实现思路

[0003]为克服相关技术中存在的问题,本公开提供一种降噪处理方法、装置、终端及存储介质。
[0004]根据本公开实施例的第一方面,提供一种降噪处理方法,应用于终端,所述方法包括:
[0005]获取待处理的第一音频信息;
[0006]确定所述第一音频信息的待处理频谱特征;
[0007]根据声学场景分类模型和所述待处理频谱特征,确定所述第一音频信息所属的声学场景类型;
[0008]根据所述声学场景类型对所述第一音频信息进行降噪处理,得到降噪后的第二音频信息。
[0009]可选地,所述根据所述声学场景类型对所述第一音频信息进行降噪处理,得到降噪后的第二音频信息,包括:
[0010]根据所述声学场景类型,确定第一降噪参数;
[0011]根据所述降噪参数对所述第一音频信息进行处理,得到所述第二音频信息。
[0012]可选地,根据所述声学场景类型,确定第一降噪参数,包括:
[0013]从多个第一声学降噪模型中,确定与所述声学场景类型匹配的第一目标声学降噪模型;
[0014]根据所述待处理频谱特征和所述第一目标声学降噪模型,确定所述第一降噪参数。
[0015]可选地,所述第一声学降噪模型通过以下方式训练:
[0016]构建多个第一声学降噪样本对,所述第一声学降噪样本对包括第一频谱特征样本和第一降噪参数样本;
[0017]将使用所述多个第一声学降噪样本对训练完成的神经网络模型,作为所述第一声学降噪模型。
[0018]可选地,所述第一声学降噪样本对通过以下方法构建:
[0019]获取目标声学场景类型的第二音频信息样本;
[0020]将所述目标声学场景类型的噪音信息与所述第二音频信息样本进行合成处理,确定第一音频信息样本;
[0021]根据所述第一音频信息样本,确定所述第一频谱特征样本;
[0022]根据所述第一音频信息样本和所述第二音频信息样本,确定所述第一降噪参数样本;
[0023]将所述第一频谱特征样本作为输入样本、所述第一降噪参数样本作为输出样本,构建所述第一声学降噪样本对。
[0024]可选地,所述获取待处理的第一音频信息之后,所述方法包括:
[0025]对所述第一音频信息进行噪声识别,确定预设噪声类型的目标噪声;
[0026]确定所述目标噪声的响度信息;
[0027]根据所述响度信息,确定所述目标噪声的第二降噪参数;
[0028]所述根据所述降噪参数对所述第一音频信息进行处理,得到降噪后的第二音频信息,包括:
[0029]根据第一降噪参数和所述第二降噪参数,对所述第一音频信息进行降噪处理,得到所述第二音频信息。
[0030]可选地,所述根据所述声学场景类型对所述第一音频信息进行处理,得到降噪后的第二音频信息,包括:
[0031]从多个第二声学降噪模型中,确定与所述声学场景类型匹配的第二目标声学降噪模型;
[0032]根据所述待处理频谱特征和所述第二目标声学降噪模型,确定已处理频谱特征;
[0033]根据所述已处理频谱特征,确定降噪后的所述第二音频信息。
[0034]可选地,所述第二声学降噪模型通过以下方式训练:
[0035]构建多个所述第二声学降噪样本对,所述第二声学降噪样本对包括第三频谱特征样本样本和第四频谱特征样本;
[0036]将使用所述多个第二声学降噪样本对训练完成的神经网络模型,作为所述第二声学降噪模型。
[0037]可选地,所述第二声学降噪样本对通过以下方法构建:
[0038]获取目标声学场景类型的第四音频信息样本;
[0039]根据所述第四音频信息样本,确定所述第四频谱特征样本;
[0040]将所述目标声学场景类型的噪音信息与所述第四音频信息样本进行合成处理,确定第三音频信息样本;
[0041]根据所述第三音频信息样本,确定所述第三频谱特征样本;
[0042]将所述第三频谱特征样本作为输出样本、所述第四频谱特征样本作为输出样本,构建所述第二声学降噪样本对。
[0043]可选地,所述根据声学场景分类模型和所述待处理频谱特征,确定所述第一音频信息所属的声学场景类型,包括:
[0044]根据所述待处理频谱特征和所述声学场景分类模型,确定音频场景信息;
[0045]根据所述音频场景信息,确定所述第一音频信息所属的所述声学场景类型。
[0046]可选地,所述声学场景分类模型通过以下方式训练:
[0047]构建多个声学场景分类样本对,所述声学场景分类样本对包括第五频谱特征样本和音频场景信息样本;其中,所述第五频谱特征样本和所述音频场景信息样本分别对应于同一第五音频信息样本;
[0048]将使用所述多个声学场景分类样本对训练完成的神经网络模型,作为所述声学场景分类模型。
[0049]可选地,所述声学场景类型包括以下中的至少一种:人声场景类型、环境场景类型和音乐场景类型。
[0050]可选地,所述获取待处理的第一音频信息,包括:
[0051]获取第一视频信息中的原始音频信息,将所述原始音频信息作为所述第一音频信息;
[0052]所述方法还包括:
[0053]获取所述第一视频信息中的原始图像信息;
[0054]根据所述原始图像信息和所述降噪音频信息,确定降噪处理后的第二视频信息。
[0055]根据本公开实施例的第二方面,提供一种降噪处理装置,应用于终端,所述装置包括:
[0056]获取模块,用于获取待处理的第一音频信息;
[0057]确定模块,用于确定所述第一音频信息的待处理频谱特征;
[0058]还用于根据声学场景分类模型和所述待处理频谱特征,确定所述第一音频信息所属的声学场景类型;
[0059]处理模块,用于根据所述声学场景类型对所述第一音频信息进行降噪处理,得到降噪后的第二音频信息。
[0060]可选地,所述处理模块,还用于:
[0061]根据所述声学场景类型,确定第一降噪参数;
[0062]根据所述降噪参数对所述第一音频信息进行处理,得到所述第二音频信息。
[0063]可选地,所述确定模块,还用于:
[0064]从多个第一声学降噪模型中,确定与所述声学场景类型匹配的第一目标声学降噪模型;
[0065]根据所述待处理频谱特征和所述第一目标声学降噪模型,确定所述第一降噪参数。...

【技术保护点】

【技术特征摘要】
1.一种降噪处理方法,应用于终端,其特征在于,所述方法包括:获取待处理的第一音频信息;确定所述第一音频信息的待处理频谱特征;根据声学场景分类模型和所述待处理频谱特征,确定所述第一音频信息所属的声学场景类型;根据所述声学场景类型对所述第一音频信息进行降噪处理,得到降噪后的第二音频信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述声学场景类型对所述第一音频信息进行降噪处理,得到降噪后的第二音频信息,包括:根据所述声学场景类型,确定第一降噪参数;根据所述降噪参数对所述第一音频信息进行处理,得到所述第二音频信息。3.根据权利要求2所述的方法,其特征在于,根据所述声学场景类型,确定第一降噪参数,包括:从多个第一声学降噪模型中,确定与所述声学场景类型匹配的第一目标声学降噪模型;根据所述待处理频谱特征和所述第一目标声学降噪模型,确定所述第一降噪参数。4.根据权利要求3所述的方法,其特征在于,所述第一声学降噪模型通过以下方式训练:构建多个第一声学降噪样本对,所述第一声学降噪样本对包括第一频谱特征样本和第一降噪参数样本;将使用所述多个第一声学降噪样本对训练完成的神经网络模型,作为所述第一声学降噪模型。5.根据权利要求4所述的方法,其特征在于,所述第一声学降噪样本对通过以下方法构建:获取目标声学场景类型的第二音频信息样本;将所述目标声学场景类型的噪音信息与所述第二音频信息样本进行合成处理,确定第一音频信息样本;根据所述第一音频信息样本,确定所述第一频谱特征样本;根据所述第一音频信息样本和所述第二音频信息样本,确定所述第一降噪参数样本;将所述第一频谱特征样本作为输入样本、所述第一降噪参数样本作为输出样本,构建所述第一声学降噪样本对。6.根据权利要求2所述的方法,其特征在于,所述获取待处理的第一音频信息之后,所述方法包括:对所述第一音频信息进行噪声识别,确定预设噪声类型的目标噪声;确定所述目标噪声的响度信息;根据所述响度信息,确定所述目标噪声的第二降噪参数;所述根据所述降噪参数对所述第一音频信息进行处理,得到降噪后的第二音频信息,包括:根据第一降噪参数和所述第二降噪参数,对所述第一音频信息进行降噪处理,得到所
述第二音频信息。7.根据权利要求1所述的方法,其特征在于,所述根据所述声学场景类型对所述第一音频信息进行处理,得到降噪后的第二音频信息,包括:从多个第二声学降噪模型中,确定与所述声学场景类型匹配的第二目标声学降噪模型;根据所述待处理频谱特征和所述第二目标声学降噪模型,确定已处理频谱特征;根据所述已处理频谱特征,确定降噪后的所述第二音频信息。8.根据权利要求7所述的方法,其特征在于,所述第二声学降噪模型通过以下方式训练:构建多个所述第二声学降噪样本对,所述第二声...

【专利技术属性】
技术研发人员:贾冲王林章冯靖鹏王倩李传宝
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1