语音变速的方法技术

技术编号:3050313 阅读:242 留言:0更新日期:2012-04-11 18:40
一种语音变速的方法包含下列步骤:接收原始语音信号;计算出该原始语音信号的基本周期;依据该基本周期定义搜寻范围;在该原始语音信号的每个该搜寻范围内寻找最大值;依据该最大值将该原始语音信号划分为多个语音区段;依据变速指令对该原始语音信号的每个该语音区段进行变速运算,而取得变速语音信号;及输出该变速语音信号。上述方法的好处是,将语音信号以最细小的基本周期单位进行后续的变速处理。

【技术实现步骤摘要】

本专利技术是一种,别是一种基于语音信号的基本周期的语 音变速的方法。
技术介绍
具备语言学习功能的电子设备,可以将所欲学习的语言会话预先录制在 该设备中,而该电子设备可为便携式,让使用者可以随时随地进行语言的学 习。然而,每一位使用者的程度并不相同,造成一段播放速度相同的会话, 有些使用者听起来会觉得阅读速度适当而可以听懂,但却有些使用者会觉得 阅读速度过快而听不懂。因此变速播放的功能成为语言学习机所具备的功能 之一。所谓变速播放指的是语言学习机在语音播放时,可以依使用者的需求而 变更播放的速度,而且当速度变更时音调却不变。因此理想上,不论变速播 放是变慢或变快,使用者在聆听上都可以听得清楚,而这一项功能对于语言 学习有很大的帮助。传统语言学习机虽然具有变速播放的功能,但往往经过变速播放后其所 播放出来的语音便会失真。由于语音信号是连续性的模拟信号,随着不同人 的发声或不同的音源所产生的声纹频率并不相同。 一般公知的语音变速的技 术的做法是将取样而得的语音数据重复播放,或以间隔的方式跳跃播放,而 达到播放速度的变更。这样的做法虽然可以达到播放速度变慢或变快,且与 原语音的信号包格线相同,但是会造成回音与机械音。同时造成声纹频率降 低,效果就如同将录音机马达转速变慢或变快一样,使得语音明显失真。因此,如何让使用者在语言学习机上操作变速播放的功能时,语音变速 后能维持原音的音调而不失真,为一亟待解决的问题。
技术实现思路
有鉴于此本专利技术提出一种,针对语音信号进行处理,让 使用者按照自己的需求加速或减速语音的播放,而语音经过变速后输出到使 用者的耳朵, 一样能清楚而不失原音调的语音。本专利技术所提出的一种,包含下列步骤接收一原始语音 信号;计算出该原始语音信号的一基本周期;依据该基本周期定义一搜寻范 围;在该原始语音信号的每个该搜寻范围内寻找一最大值;依据该最大值将 该原始语音信号划分为多个语音区段;依据一变速指令对该原始语音信号的 每个该语音区段进行一变速运算,而取得一变速语音信号;及输出该变速语 音信号。如本专利技术所述的,其中该基本周期系利用一总和振幅 差异函数计算出。如本专利技术所述的,其中该基本周期系利用一平均振幅 差异函数计算出。如本专利技术所述的,其中该变速指令为减速时,该变速 运算复制部分该语音区段,使该变速语音信号长于该原始语音信号。如本专利技术所述的,其中该变速指令为加速时,该变速 运算删除部分该语音区段,使该变速语音信号短于该原始语音信号。如本专利技术所述的,其中该变速运算包含下列步骤将 该原始语音信号的每个该语音区段乘以一比重函数,成为一比重区段;及叠 加该比重区段。如本专利技术所述的,其中该变速运算更包含下列步骤 插入叠加后的该比重区段在该语音区段之间。如本专利技术所述的,其中该变速运算更包含下列步骤 以叠加后的该比重区段取代该语音区段。如本专利技术所述的,其中该比重函数在每一该搜寻范围 内,在该最大值之前为递增函数,在该最大值之后为递减函数。如本专利技术所述的,其中该比重函数为三角波函数。如本专利技术所述的,其中该语音区段大小不同时,该语 音区段的重叠部分乘以该比重函数,未重叠部分不需乘以该比重函数。、本专利技术一开始先将原始语音信号区分为多个语音区段。所分割的区段并 不是如传统技术一般为固定的,而是根据总和振幅差异函数(Sum of Magnitude Difference Function, SMDF)或平均振幅差异函数(Average of Magnitude Difference Function, AMDF),先取得原始语音信号的基本周期 (pitch period),再根据基本周期左右附近的数据去寻找最大值。接着利用 寻找出的最大值将原始语音信号划分为多个语音区段。上述作法的好处是, 将语音信号以最细小的基本周期单位进行后续的变速处理。因此,本专利技术采 用更精确的方法来改良相关的语音变速质量。附图说明图1是的流程图。 图2是语音信号的基本周期。图3是利用总和振幅差异函数(SMDF)计算出基本周期的示意图。图4是原始语音信号的语音区段划分图。图5是变速指令为减速时的变速运算示意图。图6是变速指令为加速时的变速运算示意图。图7是变速运算的细部流程图。图8是变速运算叠加后的插入语音区段示意图。图9是变速运算叠加后的取代语音区段示意图。图IO是语音区段大小不同的叠加示意图。其中附图标记说明如下步骤S10:接收原始语音信号。步骤S20:计算出原始语音信号的基本周期。步骤S30:依据基本周期定义搜寻范围。步骤S40:在原始语音信号的每个搜寻范围内寻找最大值。步骤S50:依据最大值将原始语音信号划分为多个语音区段。步骤S60:依据变速指令对原始语音信号的每一语音区段进行变速运算,而取得变速语音信号。步骤S62:将原始语音信号的每一语音区段乘以比重函数,成为比重区段。步骤S64:叠加比重区段。步骤S70:输出变速语音信号。 具体实旌方式以下参照附图,解释有关本专利技术的较佳实施例及其功效。 请参照图1的流程图,包含下列步骤步骤S10:接收原始语音信号。原始语音信号为语言朗读,例如英语、 日语会话等。步骤S20:计算出原始语音信号的基本周期(pitch period)。人声的音 高范围大约在50Hz至1000Hz之间。而朗读同样内容的一段会话,每个人所 念出来的语音都会有所不同,这就是每个人的音色不同。音色的不同代表基 本周期的波形不同,所以每个不同的语音信号都有其不同的基本周期。由于 音色是每个人所特有的,同一个人所发出的语音信号即使语音的内容不同, 其基本周期大致上会差不多。请参照图2语音信号的基本周期。由图2所示, 一段语音信号即使有高 低起伏的变化,但是找到基本周期后,就可以清楚发现语音信号即是由多段 的基本周期所组成。所以进行语音变速处理的一开始,先找出语音信号的基 础组成单位基本周期,可以更精确的提升语音变速的质量。请参照图3利用总和振幅差异函数(SMDF)计算出基本周期的示意图。 将原始语音信号位移,和原本的原始语音信号的重叠部分进行点对点的相 减、取绝对值及相加,重复n次后会得到n个点积值,这就是所谓的总和振 幅差异函数(Sum ofMagnitude Difference Function, SMDF)。另外,上述的SMDF计算方式,由于重叠的波形越来越短,因此SMDF 的曲线会越来越小。为了避免此种情况,我们可以求取归一化SMDF,也就 是将重叠部分的点积再除以重叠的点数,这就是传统的平均振幅差异函数 (Average of Magnitude Difference Function, AMDF)。所以,禾拥SMDF 或AMDF都可以计算出原始语音信号的基本周期。步骤S30:依据步骤S20所计算出的基本周期,定义搜寻范围。虽然一 段原始的语音信号是由多段的基本周期所组成。但由于语音内容的不同(语 言朗读内容的不同),产生高低音的差别,所以每段基本周期的周期^:小会 有些微的差异。因此,计算出基本周期后,在该基本周期左右附近定i一个搜寻范围。以方便接下来要进行的搜寻动作。步骤S40:在原始语音信号的每一搜寻范围内寻找最大值。以步骤S30 所定义出的搜寻范围为单位,搜寻原始语音信号。在原始语音信号的每一搜 寻范围内本文档来自技高网...

【技术保护点】
一种语音变速的方法,包含下列步骤:接收一原始语音信号;计算出该原始语音信号的一基本周期;依据该基本周期定义一搜寻范围;在该原始语音信号的每个该搜寻范围内寻找一最大值;依据该最大值将该原始语音信号划分为 多个语音区段;依据一变速指令对该原始语音信号的每个该语音区段进行一变速运算,而取得一变速语音信号;及输出该变速语音信号。

【技术特征摘要】
1.一种语音变速的方法,包含下列步骤接收一原始语音信号;计算出该原始语音信号的一基本周期;依据该基本周期定义一搜寻范围;在该原始语音信号的每个该搜寻范围内寻找一最大值;依据该最大值将该原始语音信号划分为多个语音区段;依据一变速指令对该原始语音信号的每个该语音区段进行一变速运算,而取得一变速语音信号;及输出该变速语音信号。2. 如权利要求1的语音变速的方法,其中该基本周期系利用一总和 振幅差异函数计算出。3. 如权利要求1的语音变速的方法,其中该基本周期系利用一平均 振幅差异函数计算出。4. 如权利要求1的语音变速的方法,其中该变速指令为减速时,该 变速运算复制部分该语音区段,使该变速语音信号长于该原始语音信号。5. 如权利要求1的语音变速的方法,其中该变速指令为加速时,该 变速运算删除部分该语音区段,...

【专利技术属性】
技术研发人员:颜铭祥颜睿余高光前
申请(专利权)人:微星科技股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利