【技术实现步骤摘要】
一种可编辑的普遍音色合成分析系统及方法
[0001]本专利技术涉及音频处理
,尤其涉及一种可编辑的普遍音色合成分析系统及方法。
技术介绍
[0002]从物理学上声音可以解释为物体振动产生的声波,是通过介质(空气或固体、液体)传播并能够被人或动物听觉器官所感知的波动现象,而音色泛指声音除了频率、响度以外的所有特征的集合。作为波的一种,音色可以被分解为不同频率不同强度正弦波的叠加,因此,波形是“音色”这个抽象物质的直观表现,不同的音色都可以通过波形进行识别。
[0003]古今中外,人们根据自己的研究和喜爱,创造了多种多样的声学乐器来展现声音和旋律的优美,声学乐器演奏的每一音从数学的角度简单地说都是由许多不同频率、响度、相位的正弦波组成的, 因而形成了不同种类的音色效果,但声学乐器依赖于物体的物理振动,受到乐器自身物理属性以及人为因素的限制,对音色效果的展现存在一定的局限性。随着音乐艺术和科学技术相结合,电子音乐应运而生,在经历了具体音乐、磁带音乐和计算机音乐之后,电子音乐跨越了模拟技术到数字技术的演进,经过了半个多 ...
【技术保护点】
【技术特征摘要】
1.一种可编辑的普遍音色合成分析系统及方法,其特征在于,所述的合成分析方法用于编辑合成所有普遍或任意的声音,既可以模拟所有传统乐器的标准音高的音符对应的音色,做到实时模拟,不需要预先存储声音样本,又可以合成自然界或想象中任意已知和未知的声音,此外还能够将上述多种多级的音色进行混合编辑以产生新的音源,所述的合成分析系统共有四个组成部分:音频数据采集单元、数据处理及分析单元、电子信号合成单元、用户交互输入单元,其中:所述的音频数据采集单元用于采集声音训练样本;所述的数据处理及分析单元用于分析训练样本特征,匹配模型;所述的电子信号合成单元用于模拟音频电子信号,输出拟合后的音频数据;所述的用户交互输入单元适用于用户人工调整模型参数,用户也可使用自带的标准设定。2.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,通过谐波分析保持输入声音源音色的乐感,同时通过不和谐波的分析实现对于杂音的模拟合成,能够实现对于普遍音色的合成,实现音色的再现,系统合成的音色与源音色或设定的音色的频域特征信息完全一致,时域波形完全重合,能够真实重现想要模拟的音色的全部特征。3.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,本发明除了对钢琴、弦乐等声音清澈的传统物理乐器发出的声音有较好的模拟效果之外,对于吹管乐器、铜管乐器等音色较杂的声音的音色合成也能达到较好的模拟效果,因此无论对于清澈还是嘈杂,或是其他各类的声音都能达到较好的模拟效果,可以适用于通常难以模拟的小号/萨克斯/笛子等吹管/铜管乐器。4.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,本发明能够模拟任意声音,自然界或想象中任意已知和未知的声音,都可以进行真实的模拟和合成,而不仅仅局限于传统物理乐器发出的声音,打破了计算机环境下声学乐器的音色编辑中,必须根据真实乐器固有的音响、音域为参照标准的约束,除了乐器之外,还可以适用于其他声音音色的模拟(例如人声,动物声,环境音等),除了模拟各种现实中的声音,还可以制作自然界没有的电子音色,极大地丰富了音乐的色彩和创作的灵感。5.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,本发明通过电子信号合成实现对于音色的模拟,可以进行实时模拟,不需要预先储存相关音色的声音样本进行播放。6.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,本发明不仅能够模拟单一声音的音色,还能够将多种不同类型的源音色进行混合编辑以产生新的音源,可以编辑合成未曾出现过的音色的声音,例如两种或几种音色的混合,音色的平衡可以摆脱现实环境中实际响度的约束,人为地加以控制,任何乐器音色之间的平衡都是允许的,以求得不同音色的良好的结合,实现不同音色的互换。7.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,本发明可以提供多样化的声音输入以及多样的音色输出,训练使用的音频样本不需要为同种乐器产生的声音,不需要训练样本有相同的频率,训练参数可以使用预设参数,也可以根据情况由使用者自行调节,如没有输入声音,也可以自行设定输入参数,合成任意音色,有足够的自
由度。8.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,本发明不需要过多样本,有较快的训练速度。9.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,本发明在对不同音色的模拟合成过程中,主要通过对声音样本的谐波(倍频)以及不和谐波(非倍频)进行统计分析,应用自回归模型、交叉验证以及调和回归分析,自回归模型参数使用尤尔—沃克方程进行计算。10.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,训练样本的特征通过样本能量谱密度得到,即通过能量谱密度得到基准频率以及谐波频率分布,模拟结果通过对谐波和不和谐波的线性叠加组成。11.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,计算不和谐波的频率分布时,通过对于能量谱密度的对数变换及加权平均实现。12.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,通过调和回归分析得到谐波/不和谐波的振幅。13.如权利要求1所述的可编辑的普遍音色合成分析系统及方法,其特征在于,通过调整音色拟合中不和谐波的指数衰减,模拟自然琴弦振动中的不和谐波衰减。14.如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法,其特征在于,所述的自回归模型,指的是使用声波数据的自我回归,其数学表达式为:其中表示第个音频数据,表示自回归模型的阶数,为模型参数,需要使用样本数据拟合,为模型残差,本发明中假设互相独立,并服从相同的均值为零的正态分布。15.如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法,其特征在于,所述的尤尔一沃克方程,指的是对于自回归模型中求解模型参数的方法,方程表达式为:其中,其中,, 为数据点中延迟为的两个数据点的乘积的均值。16.如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法,其特征在于,所述的交叉验证适用于多个模型的选择,具体在本发明中应用于选择自回归模型阶数,将由一份数据集(训练集)中得到的模型(包括具体参数)应用于另一份数据集(验证集),得到验证集中的残差,自回归模型阶数则为最小所对应模型的阶数。
17. 如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法,其特征在于,所述的能量谱密度(Power Spectrum Density, PSD),表示了波的组成部分中,能量在不同频率的波中的分布情况,可以通过自回归模型得到,具体表达式为:其中为频率为的波的能量,为残差的方差,为求得的模型参数。18.如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法,其特征在于,所述的调和回归模型,指的是使用声波数据和时间数据的三角函数回归,其数学表达式为:其中表示第个音频数据,表示第个时间点,表示第个频率,,为模型参...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。