音频合成方法及相关方法、装置、设备和存储介质制造方法及图纸

技术编号:42187125 阅读:20 留言:0更新日期:2024-07-30 18:38
本申请公开了一种音频合成方法及相关方法、装置、设备和存储介质,其中,音频合成方法包括:基于素材音频进行编码,得到第一特征集合;基于第一特征集合中包含末位音频特征的至少部分音频特征进行自回归,得到对目标帧预测的音频特征,以更新第一特征集合;其中,目标帧的音频特征接续于第一特征集合中末位,且在首轮自回归之后执行自回归时参考首轮自回归;基于最新第一特征集合进行解码,得到合成音频。上述方案,能够在尽可能地合成长时音频的前提下,提升合成稳定性。

【技术实现步骤摘要】

本申请涉及音频处理,特别是涉及一种音频合成方法及相关方法、装置、设备和存储介质


技术介绍

1、在现实场景中,由于信息技术的飞速发展,音频数据在诸如辐射源识别等众多领域都得到广泛应用。然而,在诸如辐射源识别等特殊领域,由于数据较为稀缺,导致对诸如辐射源识别等下游算法造成制约。

2、目前,现有技术中存在通过音频合成来克服数据稀少的现实问题。但是,现有合成技术仍然难以稳定生成长时音频。有鉴于此,如何在尽可能地合成长时音频的前提下,提升合成稳定性,成为亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种音频合成方法及相关方法、装置、设备和存储介质,能够在尽可能地合成长时音频的前提下,提升合成稳定性。

2、为了解决上述技术问题,本申请第一方面提供了一种音频合成方法,包括:基于素材音频进行编码,得到第一特征集合;其中,第一特征集合包含素材音频中各个音频帧的音频特征;基于第一特征集合中包含末位音频特征的至少部分音频特征进行自回归,得到对目标帧预测的音频特征,以更新第一特征集合;其本文档来自技高网...

【技术保护点】

1.一种音频合成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征集合中包含末位所述音频特征的至少部分所述音频特征进行自回归,得到对目标帧预测的音频特征,以更新所述第一特征集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述第一特征分布和所述第二特征分布,采样得到最新所述目标帧的音频特征,包括:

4.根据权利要求2所述的方法,其特征在于,所述在当前所述第一特征集合中至少选择末位所述音频特征,得到第二特征集合,包括:

5.根据权利要求2所述的方法,其特征在于,在执行所述自回归之前,所述方法...

【技术特征摘要】

1.一种音频合成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征集合中包含末位所述音频特征的至少部分所述音频特征进行自回归,得到对目标帧预测的音频特征,以更新所述第一特征集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述第一特征分布和所述第二特征分布,采样得到最新所述目标帧的音频特征,包括:

4.根据权利要求2所述的方法,其特征在于,所述在当前所述第一特征集合中至少选择末位所述音频特征,得到第二特征集合,包括:

5.根据权利要求2所述的方法,其特征在于,在执行所述自回归之前,所述方法包括:

6.根据权利要求5所述的方法,其特征在于,所述特征集合和所述频谱特征的融合步骤包括:

7.根据权利要求5所述的方法,其特征在于,由所述特征集合进行自回归所得到的特征分布、由融合所述频谱特征之后的特征集合进行自回归所得到的特征分布两者的加权因...

【专利技术属性】
技术研发人员:刘炜刘恒双高天刘俊华汪小斌吕广辉
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1