音频处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:22267068 阅读:58 留言:0更新日期:2019-10-10 17:21
本申请提供一种音频处理方法、装置、电子设备和存储介质,该方法包括:对待处理音频进行切分处理,获取N个音频段,N为大于或等于2的整数;根据每个音频段的最大音量值,获取目标序列,目标序列包括:按照最大音量值从大到小排序的M个音频段的最大音量值,M为小于N的正整数;根据目标序列,获取待处理音频的音量调整参数,音量调整参数用于将待处理音频的播放音量调整为目标音量。本申请提供的音频处理方法可以通过预先获取的音量调整参数对播放的音频的音量进行调整进行处理,进而使得音频的播放音量调整为目标音量,避免了用户频繁调节音频的音量的问题。

Audio processing methods, devices, electronic devices and storage media

【技术实现步骤摘要】
音频处理方法、装置、电子设备和存储介质
本申请涉及智能终端领域,尤其涉及一种音频处理方法、装置、电子设备和存储介质。
技术介绍
随着智能终端的普及,用户通常会使用智能终端播放音乐、广播或其他音频。由于音频来源的不同(例如,提供方不同),导致音频在经终端播放时的音量也不同,可能会导致音频播放时的音量过大或过小,因此需要用户频繁调节音量。例如,终端播放音乐A时的音量为30db,但播放广播B时的音量变为10db,音量的突然减小可能使得用户听不清广播B的内容,用户需要调高音量。
技术实现思路
本申请提供一种音频处理方法、装置、电子设备和存储介质,避免了用户频繁调节音频的音量的问题。本申请的第一方面提供一种音频处理方法,其特征在于,包括:对待处理音频进行切分处理,获取N个音频段,所述N为大于或等于2的整数;根据每个所述音频段的最大音量值,获取目标序列,所述目标序列包括:按照最大音量值从大到小排序的M个音频段的最大音量值,所述M为小于所述N的正整数;根据所述目标序列,获取所述待处理音频的音量调整参数,所述音量调整参数用于将所述待处理音频的播放音量调整为目标音量。本申请的第二方面提供一种音频处理方法,包括:接收来自服务器的音频信息,所述音频信息中包括所述待处理音频的链接地址和所述音量调整参数;根据所述待处理音频的链接地址获取所述待处理音频;根据所述音量调整参数播放所述待处理音频。本申请的第三方面提供一种音频处理装置,包括:处理模块,用于对待处理音频进行切分处理,获取N个音频段,所述N为大于或等于2的整数;根据每个所述音频段的最大音量值,获取目标序列,所述目标序列包括:按照最大音量值从大到小排序的M个音频段的最大音量值,所述M为小于所述N的正整数;根据所述目标序列,获取所述待处理音频的音量调整参数,所述音量调整参数用于将所述待处理音频的播放音量调整为目标音量。本申请的第四方面提供一种音频处理装置,包括:收发模块,用于接收来自服务器的音频信息,所述音频信息中包括所述待处理音频的链接地址和所述音量调整参数;处理模块,用于根据所述待处理音频的链接地址获取所述待处理音频,并根据所述音量调整参数播放所述待处理音频。本申请的第五方面提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述音频处理装置执行第一方面或第二方面上述音频处理方法。本申请的第六方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现上述第一方面或第二方面音频处理方法。本申请提供一种音频处理方法、装置、电子设备和存储介质,该方法包括:对待处理音频进行切分处理,获取N个音频段,N为大于或等于2的整数;根据每个音频段的最大音量值,获取目标序列,目标序列包括:按照最大音量值从大到小排序的M个音频段的最大音量值,M为小于N的正整数;根据目标序列,获取待处理音频的音量调整参数,音量调整参数用于将待处理音频的播放音量调整为目标音量。本申请提供的音频处理方法可以通过预先获取的音量调整参数对播放的音频的音量进行调整进行处理,进而使得音频的播放音量调整为目标音量,避免了用户频繁调节音频的音量的问题。附图说明图1为本申请提供的音频处理方法适用的场景示意图;图2为本申请提供的音频处理方法的流程示意图一;图3为本申请提供的音频处理方法的流程示意图二;图4为本申请提供的获取音量调整参数的流程示意图;图5为本申请提供的终端根据音量调整参数播放待处理音频的方法的流程示意图;图6为本申请提供的一音频处理装置的结构示意图;图7为本申请提供的另一音频处理装置的结构示意图;图8为本申请提供的电子设备的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请的实施例,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了解决现有技术中,音频的来源不同导致的终端播放音频的音量不同,进而造成的用户需要频繁调节音量的问题,本申请提供一种音频处理方法,通过预先对音频进行处理分析获取音频的音量调整参数,采用该音量调整参数已达到对所述待处理音频的播放音量调整为目标音量的目的。下面结合具体的应用场景和实施例对本申请提供的音频处理方法进行说明。图1为本申请提供的音频处理方法适用的场景示意图。如图1所示,该场景中可以包括:服务器和终端。其中,服务器可以为云端服务器,该云端服务器可以为终端提供音频。终端可以包括但不限于为集成有音频播放功能的移动终端或固定终端。移动终端设备包括但不限于手机、个人数字助理(PersonalDigitalAssistant,简称:PDA)、平板电脑、便携设备(例如,便携式计算机、袖珍式计算机或手持式计算机)等。固定终端包括但不限于台式计算机、影音设备、智能电视、智能音箱等。下面结合图2从服务器和终端交互的角度对本申请提供的音频处理方法进行说明。图2为本申请提供的音频处理方法的流程示意图一。如图2所示,本实施例提供的音频处理方法可以包括:S201,服务器对待处理音频进行切分处理,获取N个音频段,N为大于或等于2的整数。本实施例中可以对待处理音频进行切分处理,获取N个音频段。可选的,切分处理的方式可以为逐帧切分、周期性切分、每秒切分等。其中,N为大于或等于2的整数。其中,逐帧切分可以为根据形成待处理音频的多帧音频的时间顺序进行切分,即将每帧音频为一个音频段。例如,待处理音频信息括有2000帧音频,则每一帧音频可以为一个音频段。周期性切分可以为每隔相同的时间对待处理音频进行一次切分,例如,从待处理音频的起始时间开始,每隔250ms对待处理音频进行一次切分,即获取N个音频段中每个音频段均为250ms。每秒切分可以为对每秒对应的音频切分为m帧,然后在每秒内获取任意的p帧,其中,在每秒内获取的p帧可以为一个音频段。例如,一个时长为2s的音频,则将2s的音频先切分成两个1s的音频,再将每个1s的音频切分成m帧,在每个1s的音频对应的m帧中获取p帧,则将该p帧作为一个音频段。应理解,m为大于2的整数,p为小于m的正整数。本实施例中对待处理音频进行切分处理的处理方式不做限制。S202,服务器根据每个音频段的最大音量值,获取目标序列,目标序列包括:按照最大音量值从大到小排序的M个音频段的最大音量值,M为小于N的正整数。本实施例中,服务器中可以存储有待处理音频的每个时间点的音量值,其中,每个时间点的音量值可以为待处理音频在每毫秒的音量值。本实施例中按照上述201中任一种的切分方式获取的音频段中可以包括:至少一个时间点的音频。例如,逐帧切分的方式中一个音频段为一帧音频,该一帧音频中可以包括至少一个时间点的音频。周期性切分的方式中一个音频段为250ms的音频,即也包括多个时间点的音频。其中,可以根据每个音频段中每个时间点的音量值,确定每个音频段的最大音量值,进而根据每个音频段的最大音量值,获取目标序列。本实施例中的目标序列包括:按照最大音量值从大到小排序的M个音频段本文档来自技高网...

【技术保护点】
1.一种音频处理方法,其特征在于,包括:对待处理音频进行切分处理,获取N个音频段,所述N为大于或等于2的整数;根据每个所述音频段的最大音量值,获取目标序列,所述目标序列包括:按照最大音量值从大到小排序的M个音频段的最大音量值,所述M为小于所述N的正整数;根据所述目标序列,获取所述待处理音频的音量调整参数,所述音量调整参数用于将所述待处理音频的播放音量调整为目标音量。

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:对待处理音频进行切分处理,获取N个音频段,所述N为大于或等于2的整数;根据每个所述音频段的最大音量值,获取目标序列,所述目标序列包括:按照最大音量值从大到小排序的M个音频段的最大音量值,所述M为小于所述N的正整数;根据所述目标序列,获取所述待处理音频的音量调整参数,所述音量调整参数用于将所述待处理音频的播放音量调整为目标音量。2.根据权利要求1所述的方法,其特征在于,所述音量调整参数为所述待处理音频的音量值均值,所述根据所述目标序列,获取所述待处理音频的音量调整参数,包括:若所述目标序列中所有相邻的两个最大音量值的差值均小于或等于差值阈值,则根据所述目标序列的最大音量值均值,以及所述待处理音频的时长,获取所述待处理音频的音量值均值;或者,若所述目标序列中,存在相邻的两个最大音量值的差值大于所述差值阈值,则从所述目标序列中删除位于较大最大音量值之后的所有最大音量值,得到处理后的目标序列,所述处理后的目标序列中所有相邻的两个最大音量值的差值均小于或等于所述差值阈值;将所述处理后的目标序列的最大音量值均值作为所述目标序列的最大音量值均值,并根据所述目标序列的最大音量值均值,以及所述待处理音频的时长,获取所述待处理音频的音量值均值。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标序列的最大音量值均值,以及所述待处理音频的时长,获取所述待处理音频的音量值均值,包括:若所述待处理音频的时长小于或等于时长阈值,则将所述目标序列的最大音量值均值作为候选均值;若所述待处理音频的时长大于时长阈值,则根据所述目标序列确定平滑处理系数;根据所述平滑处理系数对所述目标序列的最大音量值均值进行处理,获取所述候选均值;根据所述候选均值,获取所述待处理音频的音量值均值。4.根据权利要求3所述的方法,其特征在于,所述根据所述候选均值,获取所述待处理音频的音量值均值,包括:根据所述候选均值、预设音量值以及所述目标序列中的第一个最大音量值,获取截幅音量值;若所述截幅音量值小于或等于0,则将所述候选均值作为所述待处理音频的音量值均值;若所述截幅音量值大于0,则对所述候选均值进行缩小处理,使得根据缩小处理后的候选均值获取的截幅音量值小于或等于0,并将所述缩小处理后的候选均值作为所述待处理音频的音量值均值。5.根据权利要求1-4任一项所述的方法,其特征在于,每个所述音频段的最大音量值为:每个所述音频段的最大音频量化值对应的音量值,所述根据每个所述音频段的最大音量值,获取目标序列,包括:根据每个所述音频段中每个采样点的音频量化值,确定每个所述音频段的最大音频量化值;根据每个所述音频段的最大音频量化值,获取每个所述音频段的最大音量值;按照最大音量值从大到小的顺序,对N个所述音频段的最大音量值排序,得到初始序列;根据所述待处理音频的时长,以及音频的时长和目标序列中包括的音频段的最大音量值个数的对应关系,确定所述M;从所述初始序列中提取前M个最大音量值,获取所述目标序列。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:向终端发送音频信息,所述音频信息中包括所述待处理音频的链接地址和所述音量调整参数,所述音频信息用于指示所述终端根据待处理音频的链接地址获取所述待处理音频,并根据所述音量调整参数播放所述待处理音频。7.根据权利要求6所述的方法,其特征在于,所述音频信息中还包括:所述待处理音频的每个所述音频段中每个采样点的音频量化值。8.根据权利要求6所述的方法,其特征在于,所述对待处理音频进行切分处理,获取N个音频段之前,还包括:接收所述终端发送的音频请求信息,所述音频请求信息用于指示获取所述待处理音频;根据所述音频请求信息,获取所述待处理音频。9.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据所述音量调整参数,对所述待处理音频进行音量调整;播放音量调整后的待处理音频。10.根据权利要求9所述的方法,其特征在于,所述根据所述音量调整参数,对所述待处理音频进行音量调整...

【专利技术属性】
技术研发人员:安爱辉高睿纪东方
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1