歌唱合成数据的标注方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：39036351 阅读：27 留言：0更新日期：2023-10-10 11:49

本公开涉及计算机处理技术领域，公开了歌唱合成数据的标注方法、装置、计算机设备及存储介质，本公开提供的方法包括，获取样本音频以及样本音频的歌词文本内容，其中语音内容是通过预设插件预标注得到的；基于样本音频的时间信息，在同一界面显示语音内容以及样本音频；基于界面的显示信息，获取包括样本音频的语音内容、语音边界以及音乐信息的标注文件，语音边界是通过预设插件标注得到的，音乐信息是通过数字音频工作站得到的。利用样本音频的时间信息将样本音频与语音内容进行对齐，同时结合时间信息以及预设插件，在同一界面上显示语音内容以及样本音频，去除了重复标注歌词的环节，提高了歌唱合成数据的标注效率。提高了歌唱合成数据的标注效率。提高了歌唱合成数据的标注效率。

全部详细技术资料下载

【技术实现步骤摘要】
歌唱合成数据的标注方法、装置、计算机设备及存储介质

[0001]本公开涉及计算机处理领域，具体涉及歌唱合成数据的标注方法、装置、计算机设备及存储介质。

技术介绍

[0002]歌唱合成(singing voice synthesis，SVS)是根据歌词和乐谱信息合成歌唱。在歌唱合成技术中，基于深度学习的歌唱语音合成方法是目前歌唱合成的主流方法，该方法使用深度神经网络替换了决策树聚类上下文相关的马尔科夫模型。由于该方法的合成歌声质量取决于训练数据，歌声合成数据的标注质量和效率成为歌声制作的瓶颈之一。由于歌唱合成数据的标注包括音乐和语音学信息，分别需要音乐背景和语言学背景的人员标注，流程复杂且校对困难，从而导致歌唱合成数据的标注效率较低。

技术实现思路

[0003]有鉴于此，本公开提供了一种歌唱合成数据的标注方法、装置、计算机设备及存储介质，以解决标注效率较低的问题。
[0004]第一方面，本公开提供了一种歌唱合成数据的标注方法，所述方法包括：
[0005]获取样本音频以及所述样本音频的歌词文本内容...

【技术保护点】

【技术特征摘要】
1.一种歌唱合成数据的标注方法，其特征在于，所述方法包括：获取样本音频以及所述样本音频的歌词文本内容，所述歌词文本内容是通过预设插件进行预标注得到的；基于所述样本音频的时间信息，在同一界面显示所述歌词文本内容以及所述样本音频；基于所述界面的显示信息，获取包括所述样本音频的歌词文本内容、语音边界以及音乐信息的标注文件，所述语音边界是通过所述预设插件标注得到的，所述音乐信息通过数字音频工作站得到的。2.根据权利要求1所述的方法，其特征在于，所述基于所述样本音频的时间信息，在同一界面显示所述歌词文本内容以及所述样本音频，包括：在所述数字音频工作站的工程开头位置导入所述样本音频，并在所述样本音频的轨道上加载所述预设插件；将所述歌词文本内容与所述样本音频进行对齐显示。3.根据权利要求1所述的方法，其特征在于，所述基于所述界面的显示信息，获取包括所述样本音频的歌词文本内容、语音边界以及音乐信息的标注文件，包括：所述预设插件从所述数字音频工作站中读取播放时间；所述预设插件基于所述播放时间将所述歌词文本内容、语音边界以及所述音乐信息进行对齐显示。4.根据权利要求1所述的方法，其特征在于，所述基于所述界面的显示信息，获取包括所述样本音频的歌词文本内容、语音边界以及音乐信息的标注文件，包括：基于所述界面上显示的样本音频，获取所述预设插件对所述歌词文本内容进行音素边界的划分结果，得到所述语音边界；显示所述语音边界，并获取所述数字音频工作站对所述样本音频进行音乐信息的标注结果，得到所述音乐信息；输出包括所述歌词文本内容、所述语音边界以及所述音乐信息的标注文件。5.根据权利要求4所述的方法，其特征在于，所述基于所述界面上显示的样本音频，获取所述预设插件对所述歌词文本内容进行音素边界的划分结果，得到所述语音边界，包括：获取所述歌词文本内容的音素预标注；基于所述界面上显示的样本音频的频谱，获取所述预设插件对所述音素预标注的调整结果，得到所述语音边...

【专利技术属性】
技术研发人员：宋世奇，朱清琳，曹荣，田煦春，涂欣宇，马泽君，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人