一种背景音乐生成方法、装置及电子设备制造方法及图纸

技术编号:31827679 阅读:23 留言:0更新日期:2022-01-12 12:58
本发明专利技术公开了一种背景音乐生成方法,对获取的目标音视频数据进行语音识别,得到识别文字;利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征向量;从预先训练的音乐生成器集中,获取所述N个特征向量对应的N个音乐生成器;将所述N个特征向量中每个特征向量输入到对应的音乐生成器中,得到N种风格音乐;将所述N种风格音乐进行合成,得到背景音乐,如此,在将N种风格音乐进行合成得到背景音乐时,由于背景音乐是由N种风格音乐生成的,且N为不小于2的整数,使得背景音乐是由多种风格音乐生成的,不属于现有的音乐和歌曲,如此,使得生成的背景音乐的个性化更强,与用户的需求更匹配。配。配。

【技术实现步骤摘要】
一种背景音乐生成方法、装置及电子设备


[0001]本专利技术涉及语音处理
,特别涉及一种背景音乐生成方法、装置及电子设备。

技术介绍

[0002]音乐一直是陪伴人类的一种重要艺术形式,而人类也从未停止对音乐的探索。随着计算机技术的发展,计算机与深度学习技术的结合使得创造音乐得到越来越多的应用。
[0003]现有技术中在生成背景音乐时,通常是利用用户预先设定音乐特征参数,输入给神经网络预测未来的音符,或者使用生成对抗神经网络进行音乐生成,能够快速的生成背景音乐,但生成的背景音乐不能很好地满足用户的需求。从而,亟需一种背景音乐生成方法以解决上述问题。

技术实现思路

[0004]本专利技术实施例提供一种背景音乐生成方法、装置及电子设备,用于生成音视频文件的背景音乐。
[0005]本专利技术实施例第一方面提供一种背景音乐生成方法,所述方法包括:
[0006]对获取的目标音视频数据进行语音识别,得到识别文字;
[0007]利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征向量,其中,N为不小本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种背景音乐生成方法,其特征在于,所述方法包括:对获取的目标音视频数据进行语音识别,得到识别文字;利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征向量,其中,N为不小于2的整数;从预先训练的音乐生成器集中,获取所述N个特征向量对应的N个音乐生成器;将所述N个特征向量中每个特征向量输入到对应的音乐生成器中,得到N种风格音乐;将所述N种风格音乐进行合成,得到背景音乐。2.如权利要求1所述的方法,其特征在于,所述获取所述N个特征向量对应的N个音乐生成器,包括:获取所述N个特征向量对应的N个情感标签;根据情感标签与音乐生成器的对应关系,从所述音乐生成器集中获取与所述N个情感标签对应的所述N个音乐生成器。3.如权利要求2所述的方法,其特征在于,所述对获取的目标音视频数据进行语音识别,得到识别文字,包括:对获取的所述目标音视频数据进行音频提取,得到用户音频数据;对所述用户音频数据进行语音识别,得到所述识别文字。4.如权利要求3所述的方法,其特征在于,所述音乐生成器集的训练步骤包括,包括:获取训练样本集,所述训练样本集中每个训练样本包括训练音视频数据;针对训练样本集中的每个训练样本,对训练样本的训练音视频数据进行语音识别,得到训练识别文字;利用自然语言处理技术对所述训练识别文字进行特征提取,得到M个特征向量,其中,M为不小于N的整数;采用对抗网络,利用每个训练样本的M个特征向量对M个音乐生成器进行模型训练,得到训练好的所述M个音乐生成器,将训练好的所述M个音乐生成器作为所述音乐生成器集,其中,所述M个音乐生成器与所述M个特征向量对应。5.如权利要求1

4任一项所述的方法,其特征在于,在得到背景音乐之后,所述方法还包括:将所述背景音乐添加到所述目标音视频数据中。6.一种背景音乐生成装置,其特征在于,所述装置包括:识别单元,用于对获取的目标音视频数据进行语音识别,得到识别文字;特征提取单元,用于利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征向量,其中,N为不小于2的...

【专利技术属性】
技术研发人员:崔国辉
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1