【技术实现步骤摘要】
本专利技术涉及语音压缩和扩展技术,更具体地是涉及使用基于波形相似性的叠加技术(WSOLA)的改进版本进行语音压缩和扩展的方法和装置。在带宽和存储量有限的应用中对语音信号进行传输或变换通常会导致折衷,这种折衷或者降低了所得到的语音输出信号的质量,或者降低了此种声频信号的变换的灵活性。利用时标修正对音乐或话音进行加速或减速(最好不改变音调(pitch))具有许多应用,这些应用包括录音电话(dictation),语音邮件和声道编辑等。另一种具体应用,语音消息寻呼,对于采用当前技术的大型寻呼系统而言在经济上是不可行的。语音寻呼与音频(tone)寻呼、数字寻呼和字符数字寻呼相比需要更多的传播时间。在当前技术下,与逊于理想音质再现的音频、数字或字符数字寻呼相比,语音寻呼服务在经济上是不可行的。另一个限制语音消息寻呼的约束是带宽和当前使用寻呼信道的带宽的方法。相比之下,不管是以个人键盘的形式,还是通过打电话到话务员中心,对发送字符数字消息到寻呼终端的键盘输入设备的有限访问约束了字符数字寻呼的增长。一种语音系统克服了列出的这些问题,其中主叫方可以简单地摘下电话,拨打电话号并讲出一条消息。并且,当前没有语音寻呼系统采用摩托罗拉的FLEXTM新型高速寻呼协议结构。现有的语音寻呼系统,尤其是在大城市中,缺乏许多FLEXTM协议的优点,其中包括高电池节省率,多信道扫描能力,诸如语音加数据的模式混合,回送确认寻呼(允许向主叫方返回接收情况),位置搜寻能力,系统和频率重用。对于涉及语音信号时标变化的寻呼和诸如录音电话和语音邮件的其它应用,当前的时标变化方法缺乏理想的组合,这种组 ...
【技术保护点】
【技术特征摘要】
1.使用基于波形相似性的叠加技术(WSOLA)的改进版本对语音进行时标校正的方法,该方法包括步骤a)在存储器中存储一部分输入语音信号;b)分析该部分输入语音信号,提供估测音调值;c)根据估测音调值确定分段长度;d)根据确定出的分段长度对输入语音信号进行时标压缩。2.如权利要求1所述的方法,其中确定分段长度的步骤还包括用直接从输入语音信号确定的音调值动态调整分段长度的步骤。3.如权利要求1所述的方法,其中还包括提供等于或大于0.5的为增加输出语音质量而优化的重叠度的步骤。4.如权利要求1所述的方法,其中还包括提供小于0.5的为降低计算复杂性而优化的重叠度的步骤。5.使用基于波形相似性的叠加技术(WSOLA)的改进版本对语音进行时标校正的方法,该方法包括步骤a)在存储器中存储一部分输入语音信号;b)根据该部分输入语音信号确定一个音调周期,提供估测音调值;c)根据估测音调值确定分段长度;d)根据确定出的分段长度对输入语音信号进行时标压缩。e)对输入语音信号进行时标扩展。6.如权利要求5所述的方法,其中确定分段长度的步骤还包括用直接从输入语音信号确定的音调值动态调整分段长度的步骤。7.如权利要求5所述的方法,其中还包括提供等于或大于0.5的为增加输出语音质量而优化的重叠度的步骤。8.如权利要求5所述的方法,其中还包括提供小于0.5的为降低计算复杂性而优化的重叠度的步骤。9.在有语音能力的设备中使用的,使用基于波形相似性的叠加技术(WSOLA)的改进版本对语音进行时标校正,从而构成输出信号的方法,该方法包括步骤在输出设备上a)确定输入语音信号的音调周期,提供估测音调值;b)根据估测音调值确定分析分段长度;c)对输入语音信号进行时标扩展,从而提供输出语音信号。10.根据发话人的音调周期,使用基于波形相似性的叠加技术(WSOLA)的改进版本对语音进行时标校正的方法,该方法包括步骤a)确定输入语音信号的音调周期,提供估测音调值;b)确定接近估测音调值的两倍的分析分段长度;c)在音调低于一个预定阀值的情况下增加时标变化系数,使之高于平均时标变化系数;d)在音调高于一个预定阀值的情况下减少时标变化系数,使之低于平均时标变化系数;11.如权利要求10所述的对语音进行时标校正的方法,其中还包括步骤e)根据在步骤c或d使用的时标变化系数在语音压缩期间指定重叠度。12.如权利要求11所述的对语音进行时标校正的方法,其中还包括步骤f)以小于在步骤c或d使用的时标变化系数将近10%的系数扩展语音。13.在语音通信系统中的具有给定带宽的语音通信资源内压缩多个语音信号的方法,其中包括步骤(a)把语音通信资源子信道化,并且把多个语音信号中的至少一个放在一个子信道上;(b)压缩各子信道内的各个语音信号的时间,其中压缩各个语音信号的时间的步骤包括步骤c)确定各个语音信号的音调周期,针对各个语音信号提供对应的估测音调值;d)确定接近估测音调值的两倍的分析分段长度;e)在音调低于一个预定阀值的情况下增加时标变化系数,使之高于平均时标变化系数;f)在音调高于一个预定阀值的情况下减少时标变化系数,使之低于平均时标变化系数,其中步骤(a)至(f)的结果是提供了压缩语音信号。14.如权利要求13所述的对语音进行时标校正的方法,其中还包括步骤g)根据在步骤e或f使用的时标变化系数在语音压缩期间指定重叠度。15.如权利要求14所述的对语音进行时标校正的方法,其中还包括步骤h)以小于在步骤c或d使用的时标变化系数将近10%的系数扩展语音。16.使用语音压缩,具有至少一个发送器基站和多个选择呼叫接收器的通信系统,其中包括在发送器基站上一个接收音频信号的输入设备;一个使用WSOLA-SD技术和正交幅度调制技术压缩音频信号以提供经过处理的信号的处理设备;一个发送经过处理的信号的正交幅度调制发送器;在各个选择呼叫接收器上一个接收被发送的处理信号的选择呼叫接收器;一个使用正交幅度解调技术和WSOLA-SD扩展技术对接收的处理信号进行解调以提供一个重构信号的处理设备;一个把重构信号放大成重构音频信号的放大器。17.如权利要求16所述的通信系统,其中正交幅度调制是单边带调制。18.如权利要求16所述的通信系统,其中正交幅度调制是同相(I)和正交(Q)调制。19.如权利要求16所述的通信系统,其中通信系统包括多于一个的发送器基站,而经过处理的信号包括从至少一个选择呼叫接收器请求具有确认信号...
【专利技术属性】
技术研发人员:萨尼尔·萨特亚穆尔蒂,克里福德·达纳·雷奇,罗伯特·约汉·施文德曼,卡兹米尔兹·西维亚克,威廉·约塞夫·库兹尼基,
申请(专利权)人:摩托罗拉公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。