用于修改句子内的话音突峰的回放时序而不影响可懂度的方法和设备技术

技术编号:4561178 阅读:282 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种用于包交换通信的网络电话(VoIP)的自适应去抖动缓冲器。所呈现的去抖动缓冲方法和设备依据是在句间还是在句内检测到静默周期而修改包的回放以优化通信系统中的语音质量。在一个实例中,去抖动缓冲器确定与多个所接收的包相关联的至少一个静默周期的长度,并基于所述静默周期的所述所确定的长度确定用以发射所述包的一部分的时间。在另一实例中,静默表征器单元执行此功能。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及无线通信系统,且具体来说,涉及在用于包交换通信的网络电话(VoIP) 的自适应去抖动缓冲器中的包的回放。
技术介绍
在通信系统中,可将包的端到端的延迟界定为从其在源处产生到所述包到达其目的 地时的时间。在包交换通信系统中,包从源行进到目的地的延迟可视各种操作条件而变 化,所述操作条件包括(但不限于)信道条件和网络负载。信道条件是指无线链路的质包的端到端的延迟包括引入网络和各种元件(包经由所述元件而传递)中的延迟。 许多因素影响端到端的延迟。端到端延迟中的变化是指抖动。例如抖动等因素导致通信 质量的降级。可实施去抖动缓冲器以对抖动进行校正并改进通信系统中的总体质量。附图说明图l为通信系统的框图,其中接入终端包括自适应去抖动缓冲器;图2说明去抖动缓冲器的实例;图3说明一个实例中的去抖动缓冲延迟;图4为说明以下实例的时序图i)压缩话语片断的静默部分;以及ii)扩展话语片 断的静默部分;图5说明具有话音突峰和静默周期的话语的片断;图6说明压缩和扩展短句中的静默周期的实例;图7说明具有RTP时间戳的连续包;图8A说明所揭示方法的实例;图8B说明所揭示方法的另一实例图8C说明所揭示方法的另一实例;图9说明所揭示的方法和设备的实例的流程图;图IO为通信系统的框图,其中接入终端(AT)包括自适应去抖动缓冲器和静默表 征器单元;图11为并入有所揭示的方法和设备的实例的通信系统中的接收器的一部分的框图; 图12为说明根据一个实例的通信系统的框图,其包括自适应去抖动缓冲器和静默 表征器单元;以及图13说明所揭示的方法和设备的实例的流程图。具体实施例方式一般来说,话语由具有话音突峰周期和静默周期的句子组成。个别句子通过静默周 期分开,且一句子可包含由静默周期分开的多个话音突峰。句子可长可短,且句子内(或"句内")的静默周期通常可比分开句子的静默周期短。在本文中使用时,话音突峰通 常由多个数据包组成。在例如网络电话(VoIP)、视频电话、互动游戏、消息接发等的 许多服务和应用中,将数据形成为包且经由网络路由。一般来说,在无线通信系统中,信道条件、网络负载、系统的服务质量(QoS)能 力、不同流动造成的资源竞争尤其影响网络中包的端到端延迟。可将包的端到端延迟界 定为包在网络内从"发送器"行进到"接收器"所花费的时间。每一包可招致独特的源 到目的地的延迟,从而造成通常称为"抖动"的条件。如果接收器未能校正抖动,则当 包重新组装时所接收的消息将遭受失真。当到达接收器的包未能以规则时间间隔到达 时,可使用去抖动缓冲器来调整传入数据的不规则性。去抖动缓冲器平滑化包所经历的 抖动,且消除接收器处包到达时间的变化。在一些系统中,可使用自适应去抖动缓冲器 来延迟每一话音突峰的第一包的回放而实现此平滑化效应。可使用一算法来计算所述"去抖动延迟",或所述"去抖动延迟"可等于接收语音数据所花费的时间,等于去抖 动缓冲延迟的长度。通道条件可变化,且因此抖动可变化,且去抖动缓冲器的延迟可根据不同话音突峰 而改变以适应这些改变的条件。当调适去抖动延迟时,可用本文中称为"时间弯折"的 方法来扩展或压縮包(表示话语和静默两者)。当话语包经时间弯折时,所感知的通信 的语音质量可不受影响。然而,在某些情形下,当将时间弯折应用于静默周期时,语音 质量可能会显得降级。因此,本专利技术的目的为提供用于修改句子内的话音突峰的回放时 序而不影响可懂度的方法和设备。以下论述可应用于包化通信中,且具体来说,详细描述语音通信,其中数据或话语 和静默起源于一源处并被发射到目的地以供回放。话语通信为本论述的应用的一实例。其它应用可包括视频通信、游戏通信或具有与话语通信的特征类似的特征、规范和/或要 求的其它通信。为清楚起见,以下论述描述支持包数据通信的扩频通信系统,其包括(但 不限于)码分多址(CDMA)系统、正交频分多址(OFDMA)、宽带码分多址(W-CDMA)、 全球移动通信系统(GSM)系统、支持例如802.11 (A、 B、 G)、 802.16、 WiMAX等IEEE 标准的系统。图1为说明数字通信系统100的框图。两个接入终端(AT)130和140经由基站(BS) IIO通信。在AT130内,发射处理单元112将语音数据发射到编码器114,编码器114 编码且包化语音数据,并将经包化数据发送到低层处理单元108。为进行发射,接着将 数据发送到BS 110。 BS IIO处理所接收的数据,并将所述数据发射到AT 140,其中在 低层处理单元120处接收所述数据。接着将数据提供到去抖动缓冲器122,其存储数据 以消除或减少抖动的影响。从去抖动缓冲器122将数据发送到解码器124,且继续发送 到接收处理单元126。为了从AT 140发射,从发射处理单元116将数据/语音提供到编码器118。低层处 理单元120处理数据以供发射到BS 110。为在AT 130处接收来自BS 110的数据,在低 层处理单元108处接收数据。接着将数据包发送到去抖动缓冲器106,所述数据包存储 于所述去抖动缓冲器106处直到达到所需的缓冲长度或延迟为止。 一旦获得此长度或延 迟,则去抖动缓冲器106开始将数据发送到解码器104。解码器104将经包化数据转换 为经取样语音,并将所述包发送到接收处理单元102。在本实例中,AT130的行为类似 于AT 140。将存储装置或去抖动缓冲器用于AT (例如上述AT)中以消除抖动效应。图2说明 去抖动缓冲器的一个实例。传入的经编码包经累积并存储于缓冲器中。在一个实例中, 缓冲器为先进先出(FIFO)缓冲器,其中以特定次序接收数据并以该相同次序对其进行 处理;所处理的第一数据为所接收的第一数据。在另一实例中,去抖动缓冲器为有序清 单,其追踪接下来处理哪一包。图3说明各种情形下的包发射、接收和回放时间线。在时间to发射第一包(PKTl), 且在在时间h接收后回放。在PKT 1后以20ms的时间间隔发射后续包PKT2、 PKT 3 禾口PKT4。在没有时间弯折的情况下,解码器以规则时间间隔(例如,20ms)从第一包 的回放时间回放包。举例来说,如果解码器以规则的20ms时间间隔回放包,则在时间 t,回放第一所接收包,且将在时间t,后20ms、时间t,后40ms、时间t,后60ms等回放 后续包。如图3所说明,PKT2的预期回放时间(无去抖动缓冲延迟)为t2^+20ms。 此处,PKT2在其预期回放时间12前经接收。另一方面,包3在其预期回放时间t3=t2+207ms后经接收。此条件称为下溢。下溢出现在回放设施准备好播放一包,但所述包并不 存在于去抖动缓冲器中的时候。下溢通常致使解码器产生擦除,并使回放质量降级。图3进一步说明第二情形,在所述情形中,去抖动缓冲器在第一包的回放前引入延 迟tdjb。在此情形中,添加去抖动缓冲延迟以使回放设施能够每隔20msec接收包(或样 本)。在此情形中,即使PKT 3在其预期回放时间t3后经接收,去抖动缓冲延迟的添加 还允许在回放PKT 2 20 ms后播放PKT3。在时间to发送PKT 1 ,在时间h接收,且替代如先前在时间ti回放,现在在时间t,+tdjb-t!'回放。回放设施以预定时间间隔(例如,在P本文档来自技高网...

【技术保护点】
一种方法,其包含: 接收多个包; 存储所述所接收的包; 确定与所述所接收的多个包相关联的至少一个静默周期的长度;以及 基于所述至少一个静默周期的所述所确定的长度确定用以发射所述所存储的包的一部分的时间。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:罗西特卡普尔塞拉芬迪亚斯斯平多拉
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1