一种发送音频数据的方法和装置制造方法及图纸

技术编号:14690643 阅读:52 留言:0更新日期:2017-02-23 13:13
本发明专利技术公开了一种发送音频数据的方法和装置,属于互联网技术领域。所述方法包括:在预先存储的原唱数据库中,确定与目标歌曲的伴奏音频数据相匹配的原唱音频数据;对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据;将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据;当接收到终端发送的对应所述目标歌曲的歌曲获取请求时,向所述终端发送所述目标歌曲对应的音频数据。采用本发明专利技术,可以防止服务器的流量浪费。

【技术实现步骤摘要】

本专利技术涉及互联网
,特别涉及一种发送音频数据的方法和装置
技术介绍
随着互联网技术的发展,各种各样的终端得到了广泛的应用,相应的终端上的应用程序的种类越来越多、功能越来越丰富。比如K歌应用程序即是一种很常用的应用程序。用户想要对某首歌曲进行K歌前,可以通过操作,触发终端向服务器获取该歌曲的原唱音频数据(其中,原唱音频数据包括人声音频数据和伴奏音频数据,该原唱音频数据为单音轨音频数据)和伴奏音频数据(其中,伴奏音频数据不包括人声音频数据),当用户K歌中选择原唱模式时,终端可以对获取的原唱音频数据进行播放,当用户K歌中选择伴唱模式时,终端可以对获取的伴奏音频数据进行播放。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:基于上述处理方式,用户想要对某首歌曲进行K歌时,需要触发终端向服务器获取包括人声音频数据和伴奏音频数据的原唱音频数据,还要获取不包括人声音频数据的伴奏音频数据,即对于同一首歌曲,服务器需向终端发送两遍伴奏音频数据,由于进行K歌的用户比较多,且每个用户进行K歌的歌曲数量也比较大,将会导致服务器需要发送的数据量会非常大,从而,导致服务器的流量浪费严重。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种发送音频数据的方法和装置。所述技术方案如下:第一方面,提供了一种发送音频数据的方法,所述方法包括:在预先存储的原唱数据库中,确定与目标歌曲的伴奏音频数据相匹配的原唱音频数据;对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据;将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据;当接收到终端发送的对应所述目标歌曲的歌曲获取请求时,向所述终端发送所述目标歌曲对应的音频数据。可选的,所述方法还包括:确定所述伴奏音频数据中的伴奏播放开始时刻与所述原唱音频数据中的伴奏播放开始时刻的时间偏移值;根据所述时间偏移值,对A的播放时刻进行时间修正,得到伴奏播放开始时刻与B的伴奏播放开始时刻对齐的第一A,其中,当A为所述伴奏音频数据时,B为所述原唱音频数据,当A为所述原唱音频数据时,B为所述伴奏音频数据;所述对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据;当A为伴奏音频数据时,所述将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据,包括:将所述第一伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据。可选的,所述确定所述伴奏音频数据中的伴奏播放开始时刻与所述原唱音频数据中的伴奏播放开始时刻的时间偏移值,包括:基于预设的第一播放进度点和第二播放进度点,分别在所述伴奏音频数据中获取第一子音频数据和在所述原唱音频数据中获取第二子音频数据;对所述第一子音频数据和所述第二子音频数据进行互相关处理,得到自变量为时间偏移、因变量为相关度的互相关函数;将所述互相关函数中的因变量最大值对应的自变量值,确定为所述时间偏移值。可选的,所述根据所述时间偏移值,对A的播放时刻进行时间修正,得到伴奏播放开始时刻与所B的伴奏播放开始时刻对齐的第一A,包括:如果A的伴奏播放开始时刻延迟于B的伴奏播放开始时刻,则将所述A中所述时间偏移值对应的播放进度点之后的音频数据确定为第一A。可选的,所述方法还包括:基于所述第一A,确定在所述第一A的播放时长内的每个预设时长的子时段对应的子音频数据,并基于所述B,确定在所述B的播放时长内的所述每个预设时长的子时段对应的子音频数据;对于每个子时段,对所述第一A在所述子时段对应的子音频数据和所述B在所述子时段对应的子音频数据进行互相关处理,得到所述子时段对应的自变量为时间偏移、因变量为相关度的互相关函数;在所有子时段中,确定对应的互相关函数中的因变量最大值未达到预设相关度阈值的第一类子时段的数量;所述对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:如果所述数量未超过所述预设数量阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据。可选的,所述方法还包括:在所述所有子时段中,确定对应的互相关函数中的因变量最大值达到所述预设相关度阈值的第二类子时段;将每个第二类子时段对应的互相关函数中的因变量最大值对应的自变量值,确定为所述每个第二类子时段对应的时间偏移值;计算各第二类子时段对应的时间偏移值中的最大时间偏移值与最小时间偏移值的时间差值;所述如果所述数量未超过所述预设数量阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:如果所述数量未超过所述预设数量阈值,且所述时间差值小于预设时差阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据。第二方面,提供了一种发送音频数据的装置,所述装置包括:第一确定模块,用于在预先存储的原唱数据库中,确定与目标歌曲的伴奏音频数据相匹配的原唱音频数据;第一处理模块,用于对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据;存储模块,用于将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据;发送模块,用于当接收到终端发送的对应所述目标歌曲的歌曲获取请求时,向所述终端发送所述目标歌曲对应的音频数据。可选的,所述第一确定模块,还用于:确定所述伴奏音频数据中的伴奏播放开始时刻与所述原唱音频数据中的伴奏播放开始时刻的时间偏移值;根据所述时间偏移值,对A的播放时刻进行时间修正,得到伴奏播放开始时刻与B的伴奏播放开始时刻对齐的第一A,其中,当A为所述伴奏音频数据时,B为所述原唱音频数据,当A为所述原唱音频数据时,B为所述伴奏音频数据;所述第一处理模块,用于:对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据;所述存储模块,用于:当A为伴奏音频数据时,将所述第一伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据。可选的,所述第一确定模块,包括:获取子模块,用于基于预设的第一播放进度点和第二播放进度点,分别在所述伴奏音频数据中获取第一子音频数据和在所述原唱音频数据中获取第二子音频数据;处理子模块,用于对所述第一子音频数据和所述第二子音频数据进行互相关处理,得到自变量为时间偏移、因变量为相关度的互相关函数;确定子模块,用于将所述互相关函数中的因变量最大值对应的自变量值,确定为所述时间偏移值。可选的,所述第一确定模块,用于:如果A的伴奏播放开始时刻延迟于B的伴奏播放开始时刻,则将所述A中所述时间偏移值对应的播放进度点之后的音频数据确定为第一A。可选的,所述装置还包括:划分模块,用于基于所述第一A,确定在所述第一A的播放时长内的每个预设时长的子时段对应的子音频数据,并基于所述B,确定在所述B的播放时长内的所述每个预设时长的子时段对应的子音频数据;第二处理模块,用于对于每个子时段,对所述第一A在所述子时段对应的子音频数据和所述B在所述子时段对应的子音频数据进行互相关处理,得到所述子时段对应的自变量为时间偏移、因变量为相关度的互相关函数;第二确定模块,用于在本文档来自技高网...
一种发送音频数据的方法和装置

【技术保护点】
一种发送音频数据的方法,其特征在于,所述方法包括:在预先存储的原唱数据库中,确定与目标歌曲的伴奏音频数据相匹配的原唱音频数据;对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据;将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据;当接收到终端发送的对应所述目标歌曲的歌曲获取请求时,向所述终端发送所述目标歌曲对应的音频数据。

【技术特征摘要】
1.一种发送音频数据的方法,其特征在于,所述方法包括:在预先存储的原唱数据库中,确定与目标歌曲的伴奏音频数据相匹配的原唱音频数据;对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据;将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据;当接收到终端发送的对应所述目标歌曲的歌曲获取请求时,向所述终端发送所述目标歌曲对应的音频数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述伴奏音频数据中的伴奏播放开始时刻与所述原唱音频数据中的伴奏播放开始时刻的时间偏移值;根据所述时间偏移值,对A的播放时刻进行时间修正,得到伴奏播放开始时刻与B的伴奏播放开始时刻对齐的第一A,其中,当A为所述伴奏音频数据时,B为所述原唱音频数据,当A为所述原唱音频数据时,B为所述伴奏音频数据;所述对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据;当A为伴奏音频数据时,所述将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据,包括:将所述第一伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据。3.根据权利要求2所述的方法,其特征在于,所述确定所述伴奏音频数据中的伴奏播放开始时刻与所述原唱音频数据中的伴奏播放开始时刻的时间偏移值,包括:基于预设的第一播放进度点和第二播放进度点,分别在所述伴奏音频数据中获取第一子音频数据和在所述原唱音频数据中获取第二子音频数据;对所述第一子音频数据和所述第二子音频数据进行互相关处理,得到自变量为时间偏移、因变量为相关度的互相关函数;将所述互相关函数中的因变量最大值对应的自变量值,确定为所述时间偏移值。4.根据权利要求2所述的方法,其特征在于,所述根据所述时间偏移值,对A的播放时刻进行时间修正,得到伴奏播放开始时刻与B的伴奏播放开始时刻对齐的第一A,包括:如果A的伴奏播放开始时刻延迟于B的伴奏播放开始时刻,则将所述A中所述时间偏移值对应的播放进度点之后的音频数据确定为第一A。5.根据权利要求2或4所述的方法,其特征在于,所述方法还包括:基于所述第一A,确定在所述第一A的播放时长内的每个预设时长的子时段对应的子音频数据,并基于所述B,确定在所述B的播放时长内的所述每个预设时长的子时段对应的子音频数据;对于每个子时段,对所述第一A在所述子时段对应的子音频数据和所述B在所述子时段对应的子音频数据进行互相关处理,得到所述子时段对应的自变量为时间偏移、因变量为相关度的互相关函数;在所有子时段中,确定对应的互相关函数中的因变量最大值未达到预设相关度阈值的第一类子时段的数量;所述对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:如果所述数量未超过所述预设数量阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:在所述所有子时段中,确定对应的互相关函数中的因变量最大值达到所述预设相关度阈值的第二类子时段;将每个第二类子时段对应的互相关函数中的因变量最大值对应的自变量值,确定为所述每个第二类子时段对应的时间偏移值;计算各第二类子时段对应的时间偏移值中的最大时间偏移值与最小时间偏移值的时间差值;所述如果所述数量未超过所述预设数量阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:如果所述数量未超过所述预设数...

【专利技术属性】
技术研发人员:肖纯智
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1