音频调整方法、装置、设备及存储介质制造方法及图纸

技术编号:34700859 阅读:17 留言:0更新日期:2022-08-27 16:37
本发明专利技术实施例公开了一种音频调整方法、装置、设备及存储介质。该方法包括:获取当前选择的修音模式和采集的当前声音信息;若修音模式为自动模式,则对当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于第一目标频段对当前声音信息进行频段过滤得到调整后的声音信息;若修音模式为指定模式,则根据指定模式确定对应的第二目标频段,基于第二目标频段对当前声音信息进行频段过滤得到调整后的声音信息。本发明专利技术实施例能够根据实际需求自行切换修音模式,在用户指定目标频段时采用指定模式,而在不确定当前声音信息对应的目标频段时采用自动模式,适用于各种情况下的修音需求,应用范围更广。应用范围更广。应用范围更广。

【技术实现步骤摘要】
音频调整方法、装置、设备及存储介质


[0001]本专利技术涉及音频处理
,尤其涉及一种音频调整方法、装置、设备及存储介质。

技术介绍

[0002]自然界中,每种声音都有对应的频率,每种乐器或者不同的人声也有不同的频率范围。而在麦克风收音过程中,难免会收入各种噪声,以至于在播放时产生杂声,造成较差的用户体验。
[0003]现有的麦克风,一般采用手动打开低切开关(高通开关)、高切开关(低通开关)或者带通开关的方式,选择过滤掉固定频段的频率或者只保留固定频段的频率的方式。但是此种方式可供选择的频段有限,无法满足不同频段类型的采音需求。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种音频调整方法、装置、设备及存储介质,既能够通过自动模式自动匹配声音分类模型进行修音,还能够通过指定模式在自动匹配失败时进行修音,满足不同需求。
[0005]为解决上述技术问题,本专利技术采用以下技术方案:第一方面,本专利技术提供了一种音频调整方法,该方法包括:获取当前选择的修音模式和采集的当前声音信息;若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息;若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
[0006]可选的,在一些实施例中,还包括:采集包括不同声音类型的多种预设声音信息;以所述多种预设声音信息按照频率范围划分声音类型建立声音分类模型。
[0007]可选的,在一些实施例中,所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,包括:将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;判断是否存在相似度满足预设要求的预设声音信息;若是,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。
[0008]可选的,在一些实施例中,所述判断是否存在相似度满足预设要求的预设声音信息之后,还包括:
若否,则提示匹配失败,并执行所述获取当前选择的修音模式和采集的当前声音信息。
[0009]可选的,在一些实施例中,所述指定模式包括低通模式、带通模式和高通模式,所述则根据所述指定模式确定对应的第二目标频段包括:若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段;若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段;若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。
[0010]第二方面,本专利技术实施例还提供了一种音频调整装置,包括:数据获取模块,用于获取当前选择的修音模式和采集的当前声音信息;自动修音模块,用于若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息;指定修音模块,用于若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
[0011]可选的,在一些实施例中,所述自动修音模块包括:相似度匹配单元,用于将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;相似度判断单元,用于判断是否存在相似度满足预设要求的预设声音信息;频段确定单元,用于若存在,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。
[0012]可选的,在一些实施例中,所述指定模式包括低通模式、带通模式和高通模式,所述指定修音模块包括:低通单元,用于若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段;带通单元,用于若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段;高通单元,用于若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。
[0013]第三方面,本专利技术提供了一种音频设备,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本专利技术任一实施例提供的的音频调整方法。
[0014]第四方面,本专利技术提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时实现如本专利技术任一实施例提供的的音频调整方法。
[0015]同现有技术相比,本专利技术提供的音频调整方法,先获取当前选择的修音模式和采
到另一个部,它可以是直接连接到另一个部或者可能同时存在居中部。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述,只是为了说明的目的,并不表示是唯一的实施方式。
[0021]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
[0022]实施例一参见图1,本实施例提供了一种音频调整方法,可以应用于音频设备的修音过程,具体的本实施例提供的音频调整方法包括:S110、获取当前选择的修音模式和采集的当前声音信息。
[0023]本实施例中,音频设备上设置有用于采集声音信息的装置,例如麦克风,其能够实时采集当前声音信息。示例性的,本实施例提供的音频设备可以是录音设备,其用于进行曲乐的录制,能够采集各种类型的乐器声音以及人物歌声等,再例如本实施例提供的音频设备可以是通讯终端,其在通讯时用于进行通话语音的采集。
[0024]本实施例中,音频设备上还设置有用于选择修音模式的切换装置,以根据用户的指令切换音频设备的修音模式,例如物理按键,其能够根据用户的操作生成对应指令以选择修音模式。在一个具体示例中,音频设备上设置有至少一个按键,每个按键对应一种修音模式,在另一个示例中,音频设备上设置有触控屏,能够显示各种修音模式以供用户触碰选择,在还一个示例中,音频设备上设置有语音识别装置,用于接收并识别用户的语音指令,以根据用户的语音指令选择修音模式。
[0025]S120、若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
[0026]自动模式表示采用声音分类模型对当前声音信息自动匹配以选择合适的目标频段对其(当前声音信息)进行音频调整。具体的,本实施例中音频设备中预先存储有预设的声音分类模型,其能够对声音信息进行识别分类,并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频调整方法,其特征在于,包括:获取当前选择的修音模式和采集的当前声音信息;若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息;若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。2.根据权利要求1所述的音频调整方法,其特征在于,还包括:采集包括不同声音类型的多种预设声音信息;以所述多种预设声音信息按照频率范围划分声音类型并建立声音分类模型。3.根据权利要求1所述的音频调整方法,其特征在于,所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,包括:将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;判断是否存在相似度满足预设要求的预设声音信息;若是,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。4.根据权利要求3所述的音频调整方法,其特征在于,还包括:若否,则提示匹配失败,并执行所述获取当前选择的修音模式和采集的当前声音信息。5.根据权利要求1所述的音频调整方法,其特征在于,所述指定模式包括低通模式、带通模式和高通模式,所述则根据所述指定模式确定对应的第二目标频段包括:若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段;若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段;若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。6.一种音频调整装置,其特征在于,包括:数据获取模块,用于获取当前选择的修音模式和采集的当前声音信息;自动...

【专利技术属性】
技术研发人员:邓刚贾英智
申请(专利权)人:深圳市长丰影像器材有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1