一种可编辑的普遍音色合成分析系统及方法技术方案

技术编号：27210957 阅读：32 留言：0更新日期：2021-01-31 12:47

本发明专利技术提供一种可编辑的普遍音色合成分析系统及方法，所述的合成分析方法用于编辑合成所有普遍或任意的声音，既可以模拟所有传统乐器的标准音高的音符对应的音色，做到实时模拟，不需要预先存储声音样本，又可以合成自然界或想象中任意已知和未知的声音，此外还能够将上述多种多级的音色进行混合编辑以产生新的音源。首先分析样本中的谐波组成部分，保持输入声音源音色的乐感，再通过分析不和谐波的组成部分，实现对于杂音的模拟合成，能够实现是对于普遍音色的合成，实现音色的再现。所述的合成分析系统共有四个组成部分：音频数据采集单元、数据处理及分析单元、电子信号合成单元、用户交互输入单元。元、用户交互输入单元。元、用户交互输入单元。

全部详细技术资料下载

【技术实现步骤摘要】
一种可编辑的普遍音色合成分析系统及方法

[0001]本专利技术涉及音频处理
，尤其涉及一种可编辑的普遍音色合成分析系统及方法。

技术介绍

[0002]从物理学上声音可以解释为物体振动产生的声波，是通过介质（空气或固体、液体）传播并能够被人或动物听觉器官所感知的波动现象，而音色泛指声音除了频率、响度以外的所有特征的集合。作为波的一种，音色可以被分解为不同频率不同强度正弦波的叠加，因此，波形是“音色”这个抽象物质的直观表现，不同的音色都可以通过波形进行识别。
[0003]古今中外，人们根据自己的研究和喜爱，创造了多种多样的声学乐器来展现声音和旋律的优美，声学乐器演奏的每一音从数学的角度简单地说都是由许多不同频率、响度、相位的正弦波组成的, 因而形成了不同种类的音色效果，但声学乐器依赖于物体的物理振动，受到乐器自身物理属性以及人为因素的限制，对音色效果的展现存在一定的局限性。随着音乐艺术和科学技术相结合，电子音乐应运而生，在经历了具体音乐、磁带音乐和计算机音乐之后，电子音乐跨越了模拟技术到数字技术的演进，经过了半个多...

【技术保护点】

【技术特征摘要】
1.一种可编辑的普遍音色合成分析系统及方法，其特征在于，所述的合成分析方法用于编辑合成所有普遍或任意的声音，既可以模拟所有传统乐器的标准音高的音符对应的音色，做到实时模拟，不需要预先存储声音样本，又可以合成自然界或想象中任意已知和未知的声音，此外还能够将上述多种多级的音色进行混合编辑以产生新的音源，所述的合成分析系统共有四个组成部分：音频数据采集单元、数据处理及分析单元、电子信号合成单元、用户交互输入单元，其中：所述的音频数据采集单元用于采集声音训练样本；所述的数据处理及分析单元用于分析训练样本特征，匹配模型；所述的电子信号合成单元用于模拟音频电子信号，输出拟合后的音频数据；所述的用户交互输入单元适用于用户人工调整模型参数，用户也可使用自带的标准设定。2.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，通过谐波分析保持输入声音源音色的乐感，同时通过不和谐波的分析实现对于杂音的模拟合成，能够实现对于普遍音色的合成，实现音色的再现，系统合成的音色与源音色或设定的音色的频域特征信息完全一致，时域波形完全重合，能够真实重现想要模拟的音色的全部特征。3.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，本发明除了对钢琴、弦乐等声音清澈的传统物理乐器发出的声音有较好的模拟效果之外，对于吹管乐器、铜管乐器等音色较杂的声音的音色合成也能达到较好的模拟效果，因此无论对于清澈还是嘈杂，或是其他各类的声音都能达到较好的模拟效果，可以适用于通常难以模拟的小号/萨克斯/笛子等吹管/铜管乐器。4.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，本发明能够模拟任意声音，自然界或想象中任意已知和未知的声音，都可以进行真实的模拟和合成，而不仅仅局限于传统物理乐器发出的声音，打破了计算机环境下声学乐器的音色编辑中，必须根据真实乐器固有的音响、音域为参照标准的约束，除了乐器之外，还可以适用于其他声音音色的模拟（例如人声，动物声，环境音等），除了模拟各种现实中的声音，还可以制作自然界没有的电子音色，极大地丰富了音乐的色彩和创作的灵感。5.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，本发明通过电子信号合成实现对于音色的模拟，可以进行实时模拟，不需要预先储存相关音色的声音样本进行播放。6.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，本发明不仅能够模拟单一声音的音色，还能够将多种不同类型的源音色进行混合编辑以产生新的音源，可以编辑合成未曾出现过的音色的声音，例如两种或几种音色的混合，音色的平衡可以摆脱现实环境中实际响度的约束，人为地加以控制，任何乐器音色之间的平衡都是允许的，以求得不同音色的良好的结合，实现不同音色的互换。7.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，本发明可以提供多样化的声音输入以及多样的音色输出，训练使用的音频样本不需要为同种乐器产生的声音，不需要训练样本有相同的频率，训练参数可以使用预设参数，也可以根据情况由使用者自行调节，如没有输入声音，也可以自行设定输入参数，合成任意音色，有足够的自
由度。8.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，本发明不需要过多样本，有较快的训练速度。9.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，本发明在对不同音色的模拟合成过程中，主要通过对声音样本的谐波（倍频）以及不和谐波（非倍频）进行统计分析，应用自回归模型、交叉验证以及调和回归分析，自回归模型参数使用尤尔—沃克方程进行计算。10.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，训练样本的特征通过样本能量谱密度得到，即通过能量谱密度得到基准频率以及谐波频率分布，模拟结果通过对谐波和不和谐波的线性叠加组成。11.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，计算不和谐波的频率分布时，通过对于能量谱密度的对数变换及加权平均实现。12.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，通过调和回归分析得到谐波/不和谐波的振幅。13.如权利要求1所述的可编辑的普遍音色合成分析系统及方法，其特征在于，通过调整音色拟合中不和谐波的指数衰减，模拟自然琴弦振动中的不和谐波衰减。14.如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法，其特征在于，所述的自回归模型，指的是使用声波数据的自我回归，其数学表达式为：其中表示第个音频数据，表示自回归模型的阶数，为模型参数，需要使用样本数据拟合,为模型残差，本发明中假设互相独立，并服从相同的均值为零的正态分布。15.如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法，其特征在于，所述的尤尔一沃克方程，指的是对于自回归模型中求解模型参数的方法，方程表达式为：其中，其中，, 为数据点中延迟为的两个数据点的乘积的均值。16.如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法，其特征在于，所述的交叉验证适用于多个模型的选择，具体在本发明中应用于选择自回归模型阶数，将由一份数据集（训练集）中得到的模型（包括具体参数）应用于另一份数据集（验证集），得到验证集中的残差，自回归模型阶数则为最小所对应模型的阶数。
17. 如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法，其特征在于，所述的能量谱密度(Power Spectrum Density, PSD)，表示了波的组成部分中，能量在不同频率的波中的分布情况，可以通过自回归模型得到，具体表达式为：其中为频率为的波的能量，为残差的方差，为求得的模型参数。18.如权利要求9-13任一项所述的可编辑的普遍音色合成分析系统及方法，其特征在于，所述的调和回归模型，指的是使用声波数据和时间数据的三角函数回归，其数学表达式为：其中表示第个音频数据，表示第个时间点，表示第个频率,,为模型参...

【专利技术属性】
技术研发人员：赵利胜，赵子瑜，
申请(专利权)人：赵子瑜，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人