智能转谱模型训练方法、转谱方法、设备及介质技术

技术编号:40417872 阅读:16 留言:0更新日期:2024-02-20 22:35
本申请公开了一种智能转谱模型训练方法、转谱方法、设备及介质,涉及智能转谱技术领域,包括:将样本音频中的第一干声音频的第一频谱特征输入至目标语音识别模型,得到第一干声音频的第一语义特征;将第一频谱特征和第一语义特征调整至相同的特征维度;将第一频谱特征和第一语义特征输入至待训练智能转谱模型,得到若干个概率矩阵,并基于若干个概率矩阵计算训练损失;当训练损失不满足损失条件时,返回至将第一频谱特征和第一语义特征输入至待训练智能转谱模型的步骤,得到训练损失满损失条件的目标智能转谱模型。本申请通过融合音频的语义信息和频谱信息,使得目标智能转谱模型能够更好地识别音符的边界点,从而提升了智能转谱的准确性。

【技术实现步骤摘要】

本专利技术涉及智能转谱,特别涉及一种智能转谱模型训练方法、转谱方法、设备及介质


技术介绍

1、智能转谱技术是指通过分离出歌曲中的人声,并识别人声中的音高和音符的边界。智能转谱技术有着广泛的应用,尤其在aigc(artificial intelligence generatedcontent,人工智能生成内容)盛行的当下,智能转谱技术可以为歌声合成提供曲谱,减少人工转谱的成本。除此以外,智能转谱技术还能为k歌类游戏提供音高打分的依据。

2、现有的智能转谱算法直接通过频谱特征预测音高和音符边界信息,这种方式对于音符边界点的识别存在较大的优化空间。

3、为此,亟待一种智能转谱方法,以提高智能转谱过程中音符边界点识别的准确性。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种智能转谱模型训练方法、转谱方法、设备及介质,能够提高智能转谱的准确性,其具体方案如下:

2、第一方面,本申请公开了一种智能转谱模型训练方法,包括:

3、从样本音频中提取第一干声音频,并从所本文档来自技高网...

【技术保护点】

1.一种智能转谱模型训练方法,其特征在于,包括:

2.根据权利要求1所述的智能转谱模型训练方法,其特征在于,所述将所述第一频谱特征和所述第一语义特征输入至待训练智能转谱模型,以通过所述待训练智能转谱模型输出与若干个目标维度对应的若干个概率矩阵,包括:

3.根据权利要求1所述的智能转谱模型训练方法,其特征在于,所述将所述第一频谱特征和所述第一语义特征输入至待训练智能转谱模型,以通过所述待训练智能转谱模型输出与若干个目标维度对应的若干个概率矩阵,包括:

4.根据权利要求1所述的智能转谱模型训练方法,其特征在于,所述将所述第一频谱特征和所述第一语义特征输入至...

【技术特征摘要】

1.一种智能转谱模型训练方法,其特征在于,包括:

2.根据权利要求1所述的智能转谱模型训练方法,其特征在于,所述将所述第一频谱特征和所述第一语义特征输入至待训练智能转谱模型,以通过所述待训练智能转谱模型输出与若干个目标维度对应的若干个概率矩阵,包括:

3.根据权利要求1所述的智能转谱模型训练方法,其特征在于,所述将所述第一频谱特征和所述第一语义特征输入至待训练智能转谱模型,以通过所述待训练智能转谱模型输出与若干个目标维度对应的若干个概率矩阵,包括:

4.根据权利要求1所述的智能转谱模型训练方法,其特征在于,所述将所述第一频谱特征和所述第一语义特征输入至待训练智能转谱模型,以通过所述待训练智能转谱模型输出与若干个目标维度对应的若干个概率矩阵,包括:

5.根据权利要求1至4任一项所述的智能转谱模型训练方法,其特征在于,所述第一频谱特征包括梅尔频谱特征或cq...

【专利技术属性】
技术研发人员:王武城赵伟峰孔令城
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1