音频信号处理方法、多媒体信息处理方法、装置及电子设备制造方法及图纸

技术编号:26178793 阅读:26 留言:0更新日期:2020-10-31 14:30
本发明专利技术提供了一种音频信号处理方法,包括:获取目标音频信号的初始化参数;根据目标音频信号的初始化参数,确定对目标音频信号进行切片的起始位置和结束位置;根据起始位置和结束位置对目标音频信号进行切片处理,形成目标音频信号的切片;对目标音频信号的各个切片分别进行编码处理;将目标音频信号的各个切片的编码结果进行合并,得到与目标音频信号对应的码流。本发明专利技术还提供了多媒体信息处理方法、音频信号处理装置及存储介质。本发明专利技术能够对需要进行转码的目标音频信号进行准确地处理以形成无损码流。

Audio signal processing method, multimedia information processing method, device and electronic equipment

【技术实现步骤摘要】
音频信号处理方法、多媒体信息处理方法、装置及电子设备
本专利技术涉及音频技术,尤其涉及音频信号处理方法、多媒体信息处理方法、装置及电子设备。
技术介绍
视频服务器在对已经上传的视频信息进行转码的过程中,需要对相应的音频文件进行转码,以适应不同的网络环境或终端类型,现有的无间隙播放(Gaplessplayback)的解决方法,虽然可以解决多个音频文件无缝连续播放问题,但是并不能够支持流媒体常用高级音频编码(AAC,AdvancedAudioCoding)等编码格式,同时,无间隙播放方案利用元数据(Metadata)记录起始和结尾的静音长度,会增加码流大小,不利于适配不同的终端。
技术实现思路
本专利技术实施例提供音频信号处理方法、多媒体信息处理方法、装置及电子设备,能够对需要进行转码的目标音频信号的进行准确地处理以形成无损码流。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种音频信号处理方法,包括:获取目标音频信号的初始化参数;根据所述目标音频信号的初始化参数,确定对所述目标音频信号进行切片的起始位置和结束位置;根据所述起始位置和所述结束位置对所述目标音频信号进行切片处理,形成所述目标音频信号的切片;对所述目标音频信号的各个切片分别进行编码处理;将所述目标音频信号的各个切片的编码结果进行合并,得到与所述目标音频信号对应的码流。本专利技术实施例还提供了一种多媒体信息处理方法,所述方法包括:从多媒体信息中分离出目标音频信号和目标视频信号;根据所述目标音频信号的切片的起始位置和结束位置对所述目标音频信号进行切片处理,形成所述目标音频信号的切片;对所述目标音频信号的各个切片分别进行编码,合并编码结果得到与所述目标音频信号对应的码流;将所述目标视频信号的码流、以及所述目标视频信号的码流,封装为新的多媒体信息。本专利技术实施例还提供了一种音频信号处理装置,包括:信号获取模块,用于获取目标音频信号的初始化参数;信号切片模块,用于根据所述目标音频信号的初始化参数,确定对所述目标音频信号进行切片的起始位置和结束位置;所述信号切片模块,用于根据所述起始位置和所述结束位置对所述目标音频信号进行切片处理,形成所述目标音频信号的切片;信号编码模块,用于对所述目标音频信号的各个切片分别进行编码处理;信号合并模块,用于将所述目标音频信号的各个切片的编码结果进行合并,得到与所述目标音频信号对应的码流。上述方案中,所述信号切片模块,用于根据初始化的分片长度和编码帧长的乘积,确定所述目标音频信号切片的采样点数量;所述信号切片模块,用于对初始化的编码时延和编码帧长进行求余的操作,将求余结果确定为所述目标音频信号切片的时延补偿;所述信号切片模块,用于根据初始化的分片交叠长度与编码帧长的乘积确定第一参数,并根据编码帧长和时延补偿的差值与所述的求余结果确定第二参数;所述信号切片模块,用于根据所述第一参数与所述第二参数的和,确定所述目标音频信号切片的分片交叠样点数。上述方案中,所述信号编码模块,用于从所述目标音频信号的各个切片中提取任一切片;所述信号编码模块,用于在所述任一切片的头部添加分段的预定补偿量,形成新的音频信号,以使所述新的音频信号的分段的预定补偿量与所述目标音频信号所携带的第一补偿之和为所述音频编码标准帧长的整数倍;所述信号编码模块,用于对所述新的音频信号中的每一帧音频信号进行加窗处理,形成所述目标音频信号的不同切片的编码结果。上述方案中,所述信号编码模块,用于对所述目标音频信号的最后一个切片,在所述切片的最后一帧之后添加第二补偿,形成新的音频信号,以使所述新的音频信号的分段的预定补偿量、所述目标音频信号所携带的第一补偿与所述第二补偿之和为所述音频编码标准帧长的整数倍。上述方案中,所述信号编码模块,用于根据所述目标音频信号的切片的数量,对所述目标音频信号的各个切片进行多线程地编码处理;或者,所述信号编码模块,用于对所述目标音频信号的不同切片进行分布式地编码处理。上述方案中,所述信号合并模块,用于对所述各个切片之间的重叠帧进行删除;所述信号合并模块,用于根据所述不同切片的位置,将已经删除重叠帧的所述各个切片进行合并,形成与所述目标音频信号对应的码流。上述方案中,所述信号合并模块,用于删除所述目标音频信号的首个切片的重叠帧,且删除的帧数为第一帧数,所述第一帧数为分片交叠长度的二分之一;所述信号合并模块,用于删除所述目标音频信号的最后一个切片的重叠帧,且删除的帧数为第二帧数与所述第一帧数之和,所述第二帧数为大于或等于编码时延与编码帧长的比值的最小正整数;所述信号合并模块,用于删除所述目标音频信号的中间切片的重叠帧,且删除的帧数为第三帧数与所述第二帧数之和,所述第三帧数为分片交叠长度,所述中间切片为所述首个切片与所述最后一个切片之间的切片。本专利技术实施例还提供了一种电子设备,所述电子设备能够对多媒体信息进行处理,包括:信息分离装置,用于从多媒体信息中分离出目标音频信号和目标视频信号;音频信号处理装置,用于根据所述目标音频信号的切片的起始位置和结束位置对所述目标音频信号进行切片处理,形成所述目标音频信号的切片;所述音频信号处理装置,用于对所述目标音频信号的各个切片分别进行编码,合并编码结果得到与所述目标音频信号对应的码流;码流合并装置,用于将所述目标视频信号的码流、以及所述目标视频信号的码流,封装为新的多媒体信息。本专利技术实施例还提供了一种音频信号处理装置,所述音频信号处理装置包括:存储器,用于存储可执行指令;处理器,用于运行所述存储器存储的可执行指令时,实现前序的音频信号处理方法。本专利技术实施例还提供了一种电子设备,所述电子设备包括:存储器,用于存储可执行指令;处理器,用于运行所述存储器存储的可执行指令时,实现前序的多媒体信息处理方法。本专利技术实施例还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现本专利技术实施例提供的音频信号处理方法,或者实现本专利技术实施例提供的多媒体信息处理方法。本专利技术实施例具有以下有益效果:通过根据所计算的起始位置和结束位置对目标音频信号进行准确切片处理,对目标音频信号的各个切片分别进行编码处理,得到与目标音频信号对应的码流,实现对目标音频信号进行转码的同时,还对目标音频信号进行准确地处理,以形成无损码流。附图说明图1A为本专利技术实施例提供的音频信号处理方法的使用环境示意图;图1B为本专利技术实施例提供的每个编码文件起始处和结尾处引入额外静音段的示意图;图1C为本专利技术实施例提供的AAC-LC编码算法的分片编码后的连续码流示意图;图2为本专利技术实施例提供的音频信号处理方法和多媒体信息本文档来自技高网...

【技术保护点】
1.一种音频信号处理方法,其特征在于,所述方法包括:/n获取目标音频信号的初始化参数;/n根据所述目标音频信号的初始化参数,确定对所述目标音频信号进行切片的起始位置和结束位置;/n根据所述起始位置和所述结束位置对所述目标音频信号进行切片处理,形成所述目标音频信号的切片;/n对所述目标音频信号的各个切片分别进行编码处理;/n将所述目标音频信号的各个切片的编码结果进行合并,得到与所述目标音频信号对应的码流。/n

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,所述方法包括:
获取目标音频信号的初始化参数;
根据所述目标音频信号的初始化参数,确定对所述目标音频信号进行切片的起始位置和结束位置;
根据所述起始位置和所述结束位置对所述目标音频信号进行切片处理,形成所述目标音频信号的切片;
对所述目标音频信号的各个切片分别进行编码处理;
将所述目标音频信号的各个切片的编码结果进行合并,得到与所述目标音频信号对应的码流。


2.根据权利要求1所述的方法,其特征在于,所述根据所述目标音频信号的初始化参数,确定对所述目标音频信号进行切片的起始位置和结束位置,包括:
根据所述目标音频信号的初始化参数,确定所述目标音频信号的采样点数量、时延补偿和分片交叠样点数;
根据所确定的采样点数量、时延补偿和分片交叠样点数,确定所述目标音频信号切片的所述初始位置和所述结束位置。


3.根据权利要求2所述的方法,其特征在于,所述根据所述目标音频信号的初始化参数,确定所述目标音频信号的采样点数量、时延补偿和分片交叠样点数,包括:
根据初始化的分片长度和编码帧长的乘积,确定所述目标音频信号切片的采样点数量;
对初始化的编码时延和编码帧长进行求余的操作,将求余结果确定为所述目标音频信号切片的时延补偿;
根据初始化的分片交叠长度与编码帧长的乘积确定第一参数,并根据编码帧长和时延补偿的差值与所述求余结果确定第二参数;
根据所述第一参数与所述第二参数的加和,确定所述目标音频信号切片的分片交叠样点数。


4.根据权利要求1所述的方法,其特征在于,所述对所形成的目标音频信号的不同切片分别进行编码处理,包括:
从所述目标音频信号的各个切片中提取任一切片,在所述任一切片的头部添加分段的预定补偿量,形成新的音频信号,以使
所述新的音频信号的分段的预定补偿量与所述目标音频信号所携带的第一补偿之和为所述音频编码标准帧长的整数倍;
对所述新的音频信号中的每一帧音频信号进行加窗处理,形成所述目标音频信号的不同切片的编码结果。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当所提取的任一切片为所述目标音频信号的最后一个切片时,在所述切片的最后一帧之后添加第二补偿,形成新的音频信号,以使
所述新的音频信号的分段的预定补偿量、所述目标音频信号所携带的第一补偿与所述第二补偿之和为所述音频编码标准帧长的整数倍。


6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述目标音频信号的切片的数量,对所述目标音频信号的各个切片进行多线程地编码处理;或者,
对所述目标音频信号的不同切片进行分布式地编码处理。


7.根据权利要求1至6任一项所述的方法,其特征在于,所述将所述目标音频信号的各个切片的编码结果进行合并,得到与所述目标音频信号对应的码流,包括:
对所述各个切片之间的重叠帧进行删除;
根据所述不同切片的位置,将已经删除重叠帧的所述各个切片进行合并,形成与所述目标音频信号对应的码流。


8.根据权利要求7所述的方法,其特征在于,所述对所述各个切片之间的重叠帧进行删除,包括:
删除所述目标音频信号的首个切片的重...

【专利技术属性】
技术研发人员:杜正中
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1