【技术实现步骤摘要】
本专利技术属于歌唱转录,具体涉及一种基于目标检测和语言特征的音符级自动歌唱转录方法。
技术介绍
1、音符级自动歌唱转录是最具代表性的音乐信息检索任务之一,可以从歌唱音频中预测音符的属性,即起始时间(onset),结束时间(offset)和音高值(pitch)。尽管关于音符级歌唱转录的研究已有相当长的时间,但歌唱转录的效果通常不如钢琴等单一乐器的转录效果,其原因是歌声在音高、音色、动态性以及歌词的发音方面都具有高度多样化的表现力。例如颤音、滑音等歌唱技巧使得很难找到音符边界,并且缺乏大规模的标注数据集也是该项技术的主要障碍之一。
2、目前自动歌唱转录(ast)方法主要有三种。第一类方法采用端到端的方式获取帧级的起始、结束时间和音高概率,再通过后处理获取音符级的结果。例如先使用卷积神经网络(cnn)提取声谱图的高维特征,再使用全连接层获取帧级的转录结果。第二类方法先获取起始和结束时间,再通过音高提取获取音高。例如先使用correntropy检测起始和结束时间,再使用标准音高跟踪算法获取音高。第三类方法先进行基频(f0)跟踪获取帧
...【技术保护点】
1.一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,包括以下步骤;
2.根据权利要求1所述的一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,所述步骤1具体为:
3.根据权利要求2所述的一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,所述步骤1.1具体为:
4.根据权利要求2所述的一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,所述步骤1.3中的计算公式如下:
5.根据权利要求2所述的一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,所述步骤2具
...
【技术特征摘要】
1.一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,包括以下步骤;
2.根据权利要求1所述的一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,所述步骤1具体为:
3.根据权利要求2所述的一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,所述步骤1.1具体为:
4.根据权利要求2所述的一种基于目标检测和语言特征的音符级自动歌唱转录方法,其特征在于,所述步骤1.3中的计算公式如下:
5.根据权利要求2所述的一种基于目标检测和语言特征的音符级...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。