音频调整方法、装置、服务器及计算机可读存储介质制造方法及图纸

技术编号：23559929 阅读：32 留言：0更新日期：2020-03-25 05:05

本申请公开了一种音频调整方法、装置、服务器及计算机可读存储介质，属于多媒体领域。该方法包括：通过对音频调整请求中携带的第一音频片段进行识别，得到与该第一音频片段对应的第二音频片段，该第二音频片段是第一音频片段的模板片段。再提取该第一音频片段和第二音频片段中对应音频字段的特征，从而得到两组音频字段特征。计算两组音频字段特征中每一个音频字段特征之间的距离。根据该距离，确定第一音频片段中需要进行特征调整的音频字段，按照该距离和第二音频片段中的特征对该需要特征调整的音频字段进行调整，使得调整后的第一音频片段的效果更好，更加符合用户的要求，一定程度上提升了用户的演唱水平。

Audio adjustment method, device, server and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
音频调整方法、装置、服务器及计算机可读存储介质
本申请实施例涉及多媒体领域，特别涉及一种音频调整方法、装置、服务器及计算机可读存储介质。
技术介绍
随着多媒体技术的飞速发展，越来越多的移动客户端支持歌曲的演唱和发布，当用户不满足于自己的演唱水平时，可以利用修音功能对其所演唱的歌曲进行调整，即实现音频调整，以使得调整后的歌曲效果更好。相关技术中，用户在移动客户端上任意选择一首歌曲进行演唱并录制，将录制的音频上传至服务器，服务器接收该音频，基于动态时间规整(DynamicTimeWarping，DTW)方法将用户演唱音频和模板音频进行时间上的对齐，也即是将每个歌词在演唱音频和模板音频中的起始时间进行对齐，从而可以按照模板音频中每一个歌词的起始时间，对演唱音频中的对应歌词进行变速。还可以提取演唱音频和模板音频中每一个歌词的音高，将演唱音频中音高与模板音频中音高不同的歌词进行音高的调整。从而得到调整节奏和音高之后的演唱音频，调整之后的演唱音频的效果更好。上述音频调整的过程针对用户演唱的一整首歌曲与模板音频中的...

【技术保护点】
1.一种音频调整方法，其特征在于，所述方法包括：/n接收终端发送的音频调整请求，所述音频调整请求中携带待调整的第一音频片段，所述第一音频片段为用户演唱的一首歌曲的片段；/n响应于所述音频调整请求，获取与所述第一音频片段对应的第二音频片段，所述第二音频片段为模板片段；/n计算所述第一音频片段和所述第二音频片段对应音频字段的特征之间的距离；/n基于所述距离，调整所述第一音频片段中的音频字段的特征，得到调整后的第一音频片段，所述音频字段的特征包括音高和/或节奏。/n

【技术特征摘要】
1.一种音频调整方法，其特征在于，所述方法包括：
接收终端发送的音频调整请求，所述音频调整请求中携带待调整的第一音频片段，所述第一音频片段为用户演唱的一首歌曲的片段；
响应于所述音频调整请求，获取与所述第一音频片段对应的第二音频片段，所述第二音频片段为模板片段；
计算所述第一音频片段和所述第二音频片段对应音频字段的特征之间的距离；
基于所述距离，调整所述第一音频片段中的音频字段的特征，得到调整后的第一音频片段，所述音频字段的特征包括音高和/或节奏。

2.根据权利要求1所述的方法，其特征在于，所述响应于所述音频调整请求，获取与所述第一音频片段对应的第二音频片段，包括：
提取所述第一音频片段对应的歌曲的全部模板片段；
在所述歌曲的全部模板片段中，确定与所述第一音频片段对应的第二音频片段。

3.根据权利要求2所述的方法，其特征在于，所述在所述歌曲的全部模板片段中，确定与所述第一音频片段对应的第二音频片段，包括：
计算所述第一音频片段和所述歌曲的全部模板片段中任意两个字之间的距离，形成距离矩阵，所述距离矩阵中每一个矩阵元素表示对应的两个字之间的距离；
计算所述距离矩阵中任意两个矩阵元素之间的最小路径距离，形成最小路径距离矩阵，所述最小路径距离矩阵的第一列矩阵元素与所述距离矩阵的第一列矩阵元素相同；
在所述最小路径距离矩阵的最后一列，确定最小路径的结束点，所述结束点为所述最小路径距离矩阵的最后一列中数值最小的矩阵元素；
基于所述最小路径的结束点，回溯所述最小路径，得到所述最小路径的起始点；
根据所述最小路径的起始点和结束点，确定所述第一音频片段对应的第二音频片段。

4.根据权利要求1所述的方法，其特征在于，所述计算所述第一音频片段和所述第二音频片段对应音频字段的特征之间的距离，包括：
提取所述第一音频片段中音频字段的第一特征；
提取所述第二音频片段中与所述第一音频片段中音频字段对应的第二特征；
计算所述第一特征和第二特征之间的距离。

5.根据权利要求1所述的方法，其特征在于，所述基于所述距离，调整所述第一音频片段中的音频字段的特征，得到调整后的第一音频片段，包括下述任一项：
若所述距离为第一数值，则所述第一音频片段中的特征不需要调整；
若所述距离为第二数值，则按照所述第二音频片段中的音频字段的特征对所述第一音频片段中的音频字段的特征进行调整。

6.一种音频调整装置，其特征在于，所述装置包括：
接收模块，用于接收终端发送的音频调整请求，所述音频调整请求中携带待调整的第一音频片...

【专利技术属性】
技术研发人员：肖纯智，劳振锋，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人