可对不同种类声音数据进行合成的声音合成系统技术方案

技术编号:3046590 阅读:148 留言:0更新日期:2012-04-11 18:40
一种可对不同种类声音数据进行合成的声音合成系统,其特征在于:    包括分析子系统A和合成子系统B;    分析子系统A包括一个声音文件分析模组,一个声音合成事件生成模块和一个音源数据处理模块;    声音文件分析模组对系统所接收到的声音数据进行分析,声音合成事件生成模块接收声音文件分析模组发送的相关声音信息和参数,音源数据处理模块接收声音文件分析模组发送的音源数据;声音合成事件生成模块根据所述声音文件分析模组传来的分析结果,生成适合合成子系统B合成声音信号所需的声音合成事件;音源数据处理模块把所述声音文件分析模组传来的合成声音所需要的音源数据进行统一的编码,发送到系统B的音源数据区;    合成子系统B包括一个事件调度控制模块,一个声音合成模块和一个包含有可扩展区的音源数据区;     事件调度控制模块接收子系统A中的声音合成事件生成模块传来的声音合成事件,并合理分配声音合成事件到声音合成模块中的合成通道上,声音合成模块根据合成事件中带有的关于声音采样所在位置的参数,从音源数据区中取出相应的声音采样,再根据声音合成事件包含的其他参数对声音采样进行调频和调幅等各种处理工作完成音符的合成。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种声音合成系统,特别涉及一种可对不同种类声音数据文件进行合成和再现的声音合成系统。
技术介绍
现有技术中通过声音合成系统来进行还原和再现的声音文件主要包括以下三大类声音信号文件,这类文件从根本上讲都是记录了声音本身的波形数据,采用不同的编码算法对原始波形数据进行处理进而缩减文件大小,在还原此类声音文件时,再用相应的解码器将其还原成原始的声音波形数据。MP3就是此类文件,如附图1所示,在合成声音的时候,MP3解码器对MP3数据进行解码,将其还原成PCM声音波形数据,如果需要改变声音波形特性,比如采样率、采样精度、或者增加一些类似于混响等的特殊效果,还要解码器后增加其他的模块。乐谱文件,这类文件记录着乐器演奏的节奏和音阶的信息,其本身并不包含具体声音波形数据。因此乐谱文件的特点是文件尺寸非常小,一首5分钟的大型交响乐也不过100Kbyte左右,这与声音信号文件动辄几M、几十M的尺寸是无法相比的。但它的缺点是合成方式比较复杂。就像平常我们使用的乐谱中存在简谱和五线谱之分一样,现在也存在着多种此类的乐谱文件,比如MIDI,SMAF等等。如附图2所示以MIDI的波表合成为例作简要介绍首先,包洛曲线生成器根据MIDI消息,计算出包洛曲线;其次,波形生成器从波表库中取出与MIDI消息相对应的波表数据,即所要合成乐器的真实声音的采样数据,然后再进行调频计算产生波形;最后,用包洛曲线对波形数据进行调幅完成对MIDI消息的合成。其他种类乐谱文件的合成方法与MIDI波表合成方法基本类似。语音合成文件,相对于以上两种声音文件格式,语音合成的文件最为简单,只要是文本文件就可以,尽管其合成算法的复杂度远远超过上述的两种文件,如附图3所示是对语音合成原理的简要介绍文本分析模块根据词汇支持库对语音文件进行分析,韵律建模模块在规则库的支持下进行韵律建模,语音合成器根据韵律建模的结果,从原始语音库中取出相应的语音基元,再利用特定的语音合成算法对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音。其中语音基元就是真人朗读语言片断(可能是字,也可能是词)的采样数据。在实际应用中,一个声音合成系统很难同时支持上述三种文件格式,如果需要同时支持上述三种文件格式,一般是两种做法第一种,用三个独立的系统分别处理三种文件格式,这样的缺点是解决方案不够紧凑,而且也需要附加的系统来协调三个不同合成系统的工作。第二种方法,就是设计一个系统完全实现对三种文件的支持,但是,从上面的论述可以看出,三种文件的合成方法差别很大,要实现这样一个系统无疑是非常复杂的,而且整个系统的可扩展性不强,比如说,如果需要系统也要支持SMAF(SMAF是一种附和的文件格式,它既包含像MIDI一样的乐谱数据,也包含像MP3的声音的波形信号数据),那么就需要对系统进行修改。如果系统是一枚芯片的话,那么芯片内部需要有CPU,而且还要预留其他资源,用来以后对系统进行扩展,这样做无疑是不经济的。这就需要一种可对不同文件格式且本身不带有声音波形数据的声音数据文件进行还原和合成的声音合成系统来解决以上问题。本专利技术人在研究以上文件类型后发现,三种文件的合成器还是存在着一些近似点的,比如在语音合成系统中的语音合成器这个模块功能上非常类似于乐谱文件(MIDI)的波表合成器。它们都是从音源库中提取出音源,对于波表合成来讲,它是从波表库中提取真实乐器的采样数据,而对于语音合成来讲,是从语音库中提取人朗读某个语音基元的采样。然后合成器再对采样数据进行调频和调幅来合成音乐或者语音。对于声音信号文件来讲,如果需要对经过解码器还原的声音信号进行的进一步的处理(比如改变采样率,采样精度等等),或者把多路不同的声音信号数据按一定要求进行混合的话,那么可以认为,实现这种功能的模块就是一个新的声音合成器,其中经过解码器还原得PCM波形数据就是音源。而且乐谱合成器和语音合成器也需要这样的模块。
技术实现思路
本专利技术的目的在于提出一种可对不同种类声音数据文件进行合成和再现的声音合成系统,声音分析部分和声音合成部分都相对独立,可进行很好的扩容或修改。本专利技术提出的解决方案如下一种可对不同种类声音数据进行合成的声音合成系统,包括分析子系统A和合成子系统B;分析子系统A包括一个声音文件分析模组,一个声音合成事件生成模块和一个音源数据处理模块;声音文件分析模组对系统所接收到的声音数据进行分析,声音合成事件生成模块接收声音文件分析模组发送的相关声音信息和参数,音源数据处理模块接收声音文件分析模组发送的音源数据;声音合成事件生成模块根据所述声音文件分析模组传来的分析结果,生成适合合成子系统B合成声音信号所需的声音合成事件;音源数据处理模块把所述声音文件分析模组传来的合成声音所需要的音源数据进行统一的编码,发送到系统B的音源数据区;合成子系统B包括一个事件调度控制模块,一个声音合成模块和一个包含有可扩展区的音源数据区;事件调度控制模块接收子系统A中的声音合成事件生成模块传来的声音合成事件,并合理分配声音合成事件到声音合成模块中的合成通道上,声音合成模块根据合成事件中带有的关于声音采样所在位置的参数,从音源数据区中取出相应的声音采样,再根据声音合成事件包含的其他参数对声音采样进行调频和调幅等各种处理工作完成音符的合成。所述声音文件分析模组中可同时包含有若干个相同或不同类型的声音数据分析模块,其包括但不限于乐谱数据分析模块、语音合成分析模块和声音信号分析模块。所述声音合成事件不包含具体的节奏和旋律信息,而是一些抽象出来,用于合成声音的一些参数,是声音合成过程中的具有一定共性的模型。对比现有技术,本专利技术的优点在于由于声音合成事件是声音合成过程中的具有一定共性的模型,其与具体文件格式无关,使用声音合成事件作为声音文件分析模组和声音合成模块之间的桥梁,可以实现声音合成模块完全独立,这样有利于声音合成模块的实现,而且,如果声音合成模块设计的复杂并有其他特殊效果,只不过增加声音合成事件中的参数就可以了;另外,由于分析子系统A也相对独立,可以根据需要方便的增加或者减少分析子系统A中声音文件分析模组所包含声音数据分析模块的种类,这样在构成整个合成系统的时候就非常的灵活,而且即使对分析子系统A中的某个声音数据分析模块的修改,也不会影响合成子系统B。考虑到波表库不可能太大,以及系统的扩展性,系统同时还提供了一块可读写的数据区,用来储存额外音源数据,在音源数据区中增加的可扩展区对固化的主音源数据区是一个有效补充,这样系统的主音源数据区里就可以放入比较常用音色的波表,而可扩展区中根据所要合成文件的具体情况,载入其它音源数据,这样就使得系统非常灵活。但本专利技术的优点并不限于上述所举应用领域,下面结合附图和并非特定的实施例来对本技术作更详尽的说明。附图说明图1为MP3音乐数据的还原合成示意图;图2为MIDI的波表合成原理示意图;图3为语音合成原理示意图;图4为本专利技术所述装置结构原理简图;图5为本专利技术所述实施例一的结构原理简图;图6为本专利技术所述实施例二的结构原理简图;图7为声音合成模块结构示意图;图8为声音合成事件生成模块对乐谱数据分析模块传来的分析结果进行处理的原理图;图9为包洛曲线的示意图。具体实施例方式在下面的说明中,公知的功能或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可对不同种类声音数据进行合成的声音合成系统,其特征在于包括分析子系统A和合成子系统B;分析子系统A包括一个声音文件分析模组,一个声音合成事件生成模块和一个音源数据处理模块;声音文件分析模组对系统所接收到的声音数据进行分析,声音合成事件生成模块接收声音文件分析模组发送的相关声音信息和参数,音源数据处理模块接收声音文件分析模组发送的音源数据;声音合成事件生成模块根据所述声音文件分析模组传来的分析结果,生成适合合成子系统B合成声音信号所需的声音合成事件;音源数据处理模块把所述声音文件分析模组传来的合成声音所需要的音源数据进行统一的编码,发送到系统B的音源数据区;合成子系统B包括一个事件调度控制模块,一个声音合成模块和一个包含有可扩展区的音源数据区;事件调度控制模块接收子系统A中的声音合成事件生成模块传来的声音合成事件,并合理分配声音合成事件到声音合成模块中的合成通道上,声音合成模块根据合成事件中带有的关于声音采样所在位置的参数,从音源数据区中取出相应的声音采样,再根据声音合成事件包含的其他参数对声音采样进行调频和调幅等各种处理工作完成音符的合成。2.根据权利要求1所述的声音合成系统,其特征在于,所述声音文件分析模组中包含有一个或多个乐谱数据分析模块,所述乐谱数据分析模块连接音源数据处理模块和声音合成事件生成模块。3.根据权利要求2所述的声音合成系统,其特征在于,所述声音文件分析模组中还进一步包含有一个或多个语音合成分析模块,所述语音合成分析模块连接音源数据处理模块和声音合成事件生成模块。4.根据权利要求3所述的声音合成系统,其特征在于,所述声音文件分析模组中还进一步包含有一个或多个声音信号分析模块,所述声音信号分析模块连接音源数据处理模块和声音合成事件生成模块。5.根据权利要求1所述的声音合成系统,其特征在于,所述声音文件分析模组中包含有一个或多个语音合成分析模块,所述语音合成分析模块连接音源数据处理模块和声音合成事件生成模块。6.根据权利要求5所述的声音合成系统,其特征在于,所述声音文件分析模组中还进一步包含有一个或多个声音信号分析模块,所述声音信号分析模块连接音源数据处...

【专利技术属性】
技术研发人员:张韵东赵原
申请(专利权)人:北京中星微电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利