音频通信设备、输出音频信号的方法和通信系统技术方案

技术编号:8194118 阅读:189 留言:0更新日期:2013-01-10 03:55
一种音频通信设备(10)包括输入(12),可连接到窄带音频信号源(14)。输入12可以接收具有第一带宽的窄带音频信号(16)。提取单元(18)连接到输入,并且被布置成从窄带音频信号提取多个窄带参数(20,22)。外推单元(24)被连接以接收多个窄带参数,并且被布置成从多个窄带参数来生成多个宽带参数(26)。外推单元包括一个或多个自适应神经模糊推理系统(ANFIS)模块(28)。设备(10)还包括合成单元(30),连接以接收多个宽带参数,并且被布置成使用宽带参数来生成合成宽带音频信号(32),合成宽带音频信号(32)具有宽于第一带宽的第二带宽。并且该设备包括输出(43),输出(43)可连接到声换能器(47),被布置成输出人类可感知声学信号,用于将所述合成宽带音频信号提供到声换能器。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频通信设备、用于输出音频信号的方法、通信系统和计算机程序。
技术介绍
例如,通信系统可以用于在发送器和接收器之间进行音频信号通信。通常,信号是任何随时间变化的量,例如,可以随时间变化的电流或电压电平。应该注意,随时间变化的量可以包括随时间零变化。音频信号对人类来说表示可听声学信号,例如,音乐或语音,例如,作为电或光信号。通信信道允许信号的通信,这些信号具有不大于可用信道带宽的最大带宽。诸如语音信号的信号包括各种频率。通过其最低频率和最高频率之间的信号的频谱的范围或宽度给出信号的带宽。通过人体解剖学来确定语音信号的带宽。然而,可用信道带宽可能 窄,并且可能不允许传输包含语音信号完整频谱的宽带语音信号。例如,电话网络系统音频质量差的一个原因是提供有限带宽。语音具有85-8000HZ (赫兹)范围内的感知有效能量。3400Hz以上的频率分量对于语音可懂度非常重要。然而,当语音信号经过电话信道时,频带被限制为大约300-3400HZ。这种限制导致语音质量和可懂度降低,例如,可能很难通过电话区分相似的声音。带宽扩展包括根据可用窄带信号的宽带信号的估计,并且通常基于根据统计数据将有限频带的参数集合外推到较宽频带进行带宽扩展。例如,这可以使用隐马尔可夫模型(HMM)、神经网络或码本来实现,其需要很多计算步骤。在EP 1350243A2中,示出语音带宽扩展,其中,分析窄带语音信号,并且将从提取的参数生成的合成低频带信号与从窄带语音信号经由上采样得到的信号组合。使用码本和基于能量度量的最小化来提取参数。在US 2009/0201983A1中,示出了一种在带宽扩展系统中估计高频带能量的装置。分析窄带信号,并且在上频带提取和复制滤波器系数,以仅引入少量失真。
技术实现思路
本专利技术提供一种如所附权利要求所述的音频通信设备、用于输出音频信号的方法、通信系统和计算机程序产品。在从属权利要求中阐述了本专利技术的具体实施例。根据并且参照下文中描述的实施例所阐述的,本专利技术的这些和其他方面将显而易见。附图说明参照附图,将仅通过示例的方式来描述本专利技术的进一步的细节、方面和实施例。在附图中,使用相同附图标记来表示相同或功能相似的元件。附图中的元素为了简明和清楚而被图示,并且不一定按照比例绘制。图I示意性示出音频通信设备的实施例的示例的框图。图2示意性示出钟形隶属函数的示例的图。图3示意性示出自适应神经模糊推理系统模块的现有技术示例的图。图4示意性示出自适应神经模糊推理系统模块集合的示例的框图。图5示意性示出声音分类模块的示例的框图。 图6示意性示出组合的激励信号和频谱包络提取的示例的框图。图7示意性示出用于输出音频信号的方法的示例的示图。图8示意性示出根据音频通信设备的实施例的示例句子的语音信号谱图。图9示意性示出通信系统的实施例的示例的框图。具体实施例方式因为对于大部分,可使用本领域技术人员已知的电子组件和电路来实现本专利技术的所图示的实施例,为了本专利技术基本概念的了解和认识,并且为了不混淆或转移本专利技术的教导,对超出有必要图示程度的细节将不作解释。参照图1,示意性示出音频通信设备10的实施例的示例的框图。音频通信设备10可以包括输入12,在此示例中,输入12连接到窄带音频信号源14。输入12可以从源14接收具有第一带宽的窄带音频信号16。提取单元18连接到输入12,并且被布置成从窄带音频信号16提取多个窄带参数20、22。外推单元24被连接以接收多个窄带参数20、22,并且外推单元24被布置成根据多个窄带参数来生成多个宽带参数26。应该注意,窄带参数20、22是表征窄带音频信号16的参数。提取多个参数可以是指对于信号或信号帧,确定与当前分析的信号或信号帧相对应的参数值。在此示例中,外推单元包括一个或多个自适应神经模糊推理系统(ANFIS)模块28。设备10还包括合成单元30,合成单元30被连接以接收多个宽带参数26,并且被布置成使用宽带参数来生成具有第二带宽的合成宽带音频信号32,第二带宽比第一带宽宽。设备包括输出43,在此示例中,输出43被连接到声换能器47,声换能器47被布置成输出人类可感知声学信号,输出43用于向声换能器47提供所述合成宽带音频信号。应该注意,合成宽带音频信号可以直接提供给声换能器47或者经由例如滤波设备或混合单元44的中间设备提供给声换能器47,用于提供合成宽带音频信号,作为包括附加信号分量的混合器输出信号的一部分。如下详细解释的,呈现的设备10可以允许通过使用窄带音频信号16中包含的信息来生成宽带音频信号。特别地,允许基于300-3400HZ频带中的信息来估计高频谱部分,即,可以允许在不修改现有通信架构的情况下向用户或订户提供高质量语音。例如,音频通信设备10可以被实现为集成电路。例如,可以使用电气或电子电路来实现设备10,所述电气或电子电路诸如互连以执行专用逻辑功能和/或其他专用电路的逻辑门,或者可以在可编程逻辑器件中实现设备10,或者设备10可以包括由一个或多个处理设备执行的程序指令。窄带音频信号源14可以是任何音频信号源,通过该音频信号源,仅向原始宽带音频信号提供通过音频信号表示的声学信号的原始(宽带)频谱的一部分。窄带信号的带宽小于原始声学信号的带宽。例如,窄带音频信号源14可以是仅提供有限信道带宽的电话线或任何其他通信信道。另外,例如,通过使用诸如带宽子限制麦克风的带宽限制设备来在发送侧引入带宽限制。窄带音频信号16可以设置为信号帧的序列,每个信号帧在时间上具有特定持续时间或长度。然后,对于信号帧中的一些或每一个,可以执行参数提取、外推和合成。持续时间可以是任何持续时间,例如,10毫秒(ms)、20ms或30ms。例如,由于语音信号的有限变化,帧持续时间20ms的语音信号可以提供可靠的提取参数值,并且可以允许输入信号的追踪变化。仍参照图1,窄带音频信号16被提供给提取单元18。提取单元18可以从窄带音频信号16提取任何适合的参数,诸如音频的类型(例如,浊音、清音)、信号包络、激励或任何其他适当参数。在示出的示例中,例如,提取单元18包括激励信号提取模块38、包络提取模块34和声音分类模块36。·参照图5,声音分类模块36的框图被配置为确定至少一个声音分类参数22。声音分类参数可以是例如浊音/清音标识符。为此,声音分类模块可以包括特征提取块70,特征提取块70连接到判决逻辑块72,判决逻辑块72例如包括诸如用于确定浊音/清音标识符的逻辑电路的装置。特征提取块70可以接收窄带(NB)语音信号或帧,并且可以配置为确定例如自相关比R和/或频谱平坦度Sf或频谱平坦度的导数dSf,其中,例如,高R或低Sf可以指示浊音信号帧。权利要求1.一种音频通信设备(10),包括 输入(12),所述输入(12)能够连接到窄带音频信号源(14),所述输入被布置成接收具有第一带宽的窄带音频信号(16); 提取单元(18),所述提取单元(18)连接到所述输入,并且被布置成从所述窄带音频信号提取多个窄带参数(20,22); 外推单元(24),所述外推单元(24)被连接以接收所述多个窄带参数,并且被布置成从所述多个窄带参数来生成多个宽带参数(26),所述外推单元包括一个或多个自适应神经模糊推理系统模块(28); 合成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:罗伯特·克鲁奇拉杜·D·普拉莱亚
申请(专利权)人:飞思卡尔半导体公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1