【技术实现步骤摘要】
一种背景音乐生成方法、装置及电子设备
[0001]本专利技术涉及语音处理
,特别涉及一种背景音乐生成方法、装置及电子设备。
技术介绍
[0002]音乐一直是陪伴人类的一种重要艺术形式,而人类也从未停止对音乐的探索。随着计算机技术的发展,计算机与深度学习技术的结合使得创造音乐得到越来越多的应用。
[0003]现有技术中在生成背景音乐时,通常是利用用户预先设定音乐特征参数,输入给神经网络预测未来的音符,或者使用生成对抗神经网络进行音乐生成,能够快速的生成背景音乐,但生成的背景音乐不能很好地满足用户的需求。从而,亟需一种背景音乐生成方法以解决上述问题。
技术实现思路
[0004]本专利技术实施例提供一种背景音乐生成方法、装置及电子设备,用于生成音视频文件的背景音乐。
[0005]本专利技术实施例第一方面提供一种背景音乐生成方法,所述方法包括:
[0006]对获取的目标音视频数据进行语音识别,得到识别文字;
[0007]利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征 ...
【技术保护点】
【技术特征摘要】
1.一种背景音乐生成方法,其特征在于,所述方法包括:对获取的目标音视频数据进行语音识别,得到识别文字;利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征向量,其中,N为不小于2的整数;从预先训练的音乐生成器集中,获取所述N个特征向量对应的N个音乐生成器;将所述N个特征向量中每个特征向量输入到对应的音乐生成器中,得到N种风格音乐;将所述N种风格音乐进行合成,得到背景音乐。2.如权利要求1所述的方法,其特征在于,所述获取所述N个特征向量对应的N个音乐生成器,包括:获取所述N个特征向量对应的N个情感标签;根据情感标签与音乐生成器的对应关系,从所述音乐生成器集中获取与所述N个情感标签对应的所述N个音乐生成器。3.如权利要求2所述的方法,其特征在于,所述对获取的目标音视频数据进行语音识别,得到识别文字,包括:对获取的所述目标音视频数据进行音频提取,得到用户音频数据;对所述用户音频数据进行语音识别,得到所述识别文字。4.如权利要求3所述的方法,其特征在于,所述音乐生成器集的训练步骤包括,包括:获取训练样本集,所述训练样本集中每个训练样本包括训练音视频数据;针对训练样本集中的每个训练样本,对训练样本的训练音视频数据进行语音识别,得到训练识别文字;利用自然语言处理技术对所述训练识别文字进行特征提取,得到M个特征向量,其中,M为不小于N的整数;采用对抗网络,利用每个训练样本的M个特征向量对M个音乐生成器进行模型训练,得到训练好的所述M个音乐生成器,将训练好的所述M个音乐生成器作为所述音乐生成器集,其中,所述M个音乐生成器与所述M个特征向量对应。5.如权利要求1
‑
4任一项所述的方法,其特征在于,在得到背景音乐之后,所述方法还包括:将所述背景音乐添加到所述目标音视频数据中。6.一种背景音乐生成装置,其特征在于,所述装置包括:识别单元,用于对获取的目标音视频数据进行语音识别,得到识别文字;特征提取单元,用于利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征向量,其中,N为不小于2的...
【专利技术属性】
技术研发人员:崔国辉,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。