基于语音输入的说唱音乐自动生成方法技术

技术编号：13670326 阅读：103 留言：0更新日期：2016-09-07 15:48

本发明专利技术公开了一种基于语音输入的说唱音乐自动生成方法，包括以下步骤：S1.用户输入语音信息；S2.将用户输入的语音信息转换为文本信息；S3.对文本信息进行分词，得到多个词组；S4.根据步骤S3中得到的词组从素材库中筛选出备选Riff；S5.根据步骤S3中得到的词组和语音端点检测技术对原始的语音信息进行分段，得到分段语音；S6.向分段语音和备选Riff加入效果器；S7.输出说唱音乐。本发明专利技术通过机器学习等技术的帮助，使得普通大众能够参与到音乐制作、交互这种专业活动中创造属于自己的音乐，在此过程中用户只需输入语音信息，即可自动生成相应的说唱音乐。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音乐制作
，特别是涉及一种基于语音输入的说唱音乐自动生成方法。
技术介绍
回顾音乐的发展史，音乐的创作和交互方式从未发生过大的变化。在人类文明高度发展的今天，传统上音乐首先被专业人士创作出来，进而以磁带、CD、电台或互联网音频流等形式进入大众耳朵。现场演出会可能发生的部分即兴改编，或类似于“音乐背后的创作故事”等对话交流，音乐从被创作出来，直至在大众中传播之整个过程几乎不存在任何变化。同时，音乐本身和听众之间的交互也仅停留于“你写我听”的层面。由于听众类型、情绪、喜好等外在因素和音乐本身之间缺少感应传输媒介，音乐也无法随外界输入变化而变化。近年来，在机器学习技术以及音频算法等前沿科技的驱动下，出现了PC端的音乐工作站及各类插件 (如Cubase，Protool，Ablton Live等)。Ablton Live的最新版本已支持音频文件的变速不变调以及分片操作。由于音频工作站专注于录音，缩混及后期制作，其使用局限于录音师、编曲、作曲等专业人士，其距离普通大众还很遥远。另外，音频工作站只负责提供“使用工具”，而无法胜任“创作工具”的角色。作为一种传递“人的想法”的媒介，音频工作站在人的指挥下，把人的想法落实到音乐上，把已经存在的demo加工成高品质歌曲(前提是编曲人员需要有完整的编曲思路，而音频工作站本身无法提供这种思路)。层出不穷的高质量插件(提供混响均衡等特殊音频处理)在效果上已经接近于硬件，这使得音频工作站的能力如虎添翼，然而迄今为止所有的音频工作站都无法实现“音乐自动生成”或交“互式音乐生成”。
技术实现思路
本专利技术的目的在于克服...

【技术保护点】
基于语音输入的说唱音乐自动生成方法，其特征在于：包括以下步骤：S1.用户输入语音信息；S2.将用户输入的语音信息转换为文本信息；S3.对文本信息进行分词，得到多个词组；S4.根据步骤S3中得到的词组从素材库中筛选出备选Riff；S5.根据步骤S3中得到的词组和语音端点检测技术对原始的语音信息进行分段，得到分段语音；S6.向分段语音和备选Riff加入效果器；S7.输出说唱音乐。

【技术特征摘要】
1.基于语音输入的说唱音乐自动生成方法，其特征在于：包括以下步骤：S1.用户输入语音信息；S2.将用户输入的语音信息转换为文本信息；S3.对文本信息进行分词，得到多个词组；S4.根据步骤S3中得到的词组从素材库中筛选出备选Riff；S5.根据步骤S3中得到的词组和语音端点检测技术对原始的语音信息进行分段，得到分段语音；S6.向分段语音和备选Riff加入效果器；S7.输出说唱音乐。2.根据权利要求1所述的基于语音输入的说唱音乐自动生成方法，其特征在于：所述步骤S4中，以步骤S3中得到的词组和配乐Riff之间、以及Riff和Riff之间在整体上协调性最大为目标，筛选素材库得到备选Riff。3.根据权利要求2所述的基于语音输入的说唱音乐自动生成方法，其特征在于：所述协调性包括节奏型的和谐、速度的匹配和重音的吻合。4.根据权...

【专利技术属性】
技术研发人员：汤影，杨林，
申请(专利权)人：成都涂鸦科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人