一种背景音乐生成方法、装置及电子设备制造方法及图纸

技术编号：31827679 阅读：23 留言：0更新日期：2022-01-12 12:58

本发明专利技术公开了一种背景音乐生成方法，对获取的目标音视频数据进行语音识别，得到识别文字；利用自然语言处理技术对所述识别文字进行特征提取，得到N个特征向量；从预先训练的音乐生成器集中，获取所述N个特征向量对应的N个音乐生成器；将所述N个特征向量中每个特征向量输入到对应的音乐生成器中，得到N种风格音乐；将所述N种风格音乐进行合成，得到背景音乐，如此，在将N种风格音乐进行合成得到背景音乐时，由于背景音乐是由N种风格音乐生成的，且N为不小于2的整数，使得背景音乐是由多种风格音乐生成的，不属于现有的音乐和歌曲，如此，使得生成的背景音乐的个性化更强，与用户的需求更匹配。配。配。

全部详细技术资料下载

【技术实现步骤摘要】
一种背景音乐生成方法、装置及电子设备

[0001]本专利技术涉及语音处理
，特别涉及一种背景音乐生成方法、装置及电子设备。

技术介绍

[0002]音乐一直是陪伴人类的一种重要艺术形式，而人类也从未停止对音乐的探索。随着计算机技术的发展，计算机与深度学习技术的结合使得创造音乐得到越来越多的应用。
[0003]现有技术中在生成背景音乐时，通常是利用用户预先设定音乐特征参数，输入给神经网络预测未来的音符，或者使用生成对抗神经网络进行音乐生成，能够快速的生成背景音乐，但生成的背景音乐不能很好地满足用户的需求。从而，亟需一种背景音乐生成方法以解决上述问题。

技术实现思路

[0004]本专利技术实施例提供一种背景音乐生成方法、装置及电子设备，用于生成音视频文件的背景音乐。
[0005]本专利技术实施例第一方面提供一种背景音乐生成方法，所述方法包括：
[0006]对获取的目标音视频数据进行语音识别，得到识别文字；
[0007]利用自然语言处理技术对所述识别文字进行特征提取，得到N个特征...

【技术保护点】

【技术特征摘要】
1.一种背景音乐生成方法，其特征在于，所述方法包括：对获取的目标音视频数据进行语音识别，得到识别文字；利用自然语言处理技术对所述识别文字进行特征提取，得到N个特征向量，其中，N为不小于2的整数；从预先训练的音乐生成器集中，获取所述N个特征向量对应的N个音乐生成器；将所述N个特征向量中每个特征向量输入到对应的音乐生成器中，得到N种风格音乐；将所述N种风格音乐进行合成，得到背景音乐。2.如权利要求1所述的方法，其特征在于，所述获取所述N个特征向量对应的N个音乐生成器，包括：获取所述N个特征向量对应的N个情感标签；根据情感标签与音乐生成器的对应关系，从所述音乐生成器集中获取与所述N个情感标签对应的所述N个音乐生成器。3.如权利要求2所述的方法，其特征在于，所述对获取的目标音视频数据进行语音识别，得到识别文字，包括：对获取的所述目标音视频数据进行音频提取，得到用户音频数据；对所述用户音频数据进行语音识别，得到所述识别文字。4.如权利要求3所述的方法，其特征在于，所述音乐生成器集的训练步骤包括，包括：获取训练样本集，所述训练样本集中每个训练样本包括训练音视频数据；针对训练样本集中的每个训练样本，对训练样本的训练音视频数据进行语音识别，得到训练识别文字；利用自然语言处理技术对所述训练识别文字进行特征提取，得到M个特征向量，其中，M为不小于N的整数；采用对抗网络，利用每个训练样本的M个特征向量对M个音乐生成器进行模型训练，得到训练好的所述M个音乐生成器，将训练好的所述M个音乐生成器作为所述音乐生成器集，其中，所述M个音乐生成器与所述M个特征向量对应。5.如权利要求1
‑
4任一项所述的方法，其特征在于，在得到背景音乐之后，所述方法还包括：将所述背景音乐添加到所述目标音视频数据中。6.一种背景音乐生成装置，其特征在于，所述装置包括：识别单元，用于对获取的目标音视频数据进行语音识别，得到识别文字；特征提取单元，用于利用自然语言处理技术对所述识别文字进行特征提取，得到N个特征向量，其中，N为不小于2的...

【专利技术属性】
技术研发人员：崔国辉，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人