个人化带宽扩展制造技术

技术编号:12202112 阅读:85 留言:0更新日期:2015-10-14 15:00
本发明专利技术提供一种个人化(即,说话者可导出)带宽扩展,其中用于带宽扩展的模型对每一特定用户个人化(例如,定制)。执行训练阶段以产生对用户个人化的带宽扩展模型。所述模型可随后在涉及所述用户的电话呼叫期间在带宽扩展阶段中使用。使用所述个人化带宽扩展模型的所述带宽扩展阶段将当较高频带(例如,宽带)不可用且所述呼叫正在较低频带(例如,窄带)上进行时激活。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】
技术介绍
信号的带宽扩展是众所周知且可经界定为使其中含有有用内容或效果的信号的频率范围(带宽)扩大的过程。近年来,带宽扩展已经用于经译码语音和音频的高频增强中,例如电话系统中的语音。因此,举例来说,窄带电话语音的质量可通过带宽扩展而改善。一种类型的已知带宽扩展称为盲带宽扩展。盲带宽扩展技术用以再造窄带音频信号的高频带。这些方法增加如电话或无线电通信系统中经由窄频带发射的信号的感知质量。然而,现有的盲带宽扩展技术使用一般化模型用于执行带宽扩展。此些一般化模型通常在用于任意说话者的带宽扩展中使用,其可导致不准确或不良的用户体验。
技术实现思路
本系统和方法是针对个人化(即,说话者可导出)带宽扩展,其中用于带宽扩展的模型对每一特定用户个人化(例如,定制)。在一实施方案中,执行训练阶段以产生对用户个人化的带宽扩展模型。所述模型可随后在涉及所述用户的电话呼叫期间在带宽扩展阶段中使用。使用所述个人化带宽扩展模型的所述带宽扩展阶段将当较高频带(例如,宽带)不可用且所述呼叫正在较低频带(例如,窄带)上进行时激活。在一实施方案中,在其中可识别用户(例如,通过呼叫者ID)的宽带呼叫期间在远端台(例如,移动电话)处训练模型(对用户个人化,以使得其是基于说话者可导出信息)。在另一实施方案中,在呼叫期间在近端台处(例如,在用户的移动电话处)训练模型(应注意,不管网络条件如何近端都可俘获宽带语音)。在另一实施方案中,以用户的话音或以由移动台的所有者选择的目标话音在移动台处(不在电话呼叫期间)离线训练模型。离线训练涉及当电话不在用于电话呼叫时记录用户的话音或目标话音。提供此
技术实现思路
而以简化形式引入下文在【具体实施方式】中进一步描述的概念选择。本
技术实现思路
并不希望识别所主张的标的物的关键特征或基本特征,也并非意图用于限制所主张的标的物的范围。【附图说明】当结合附图阅读时,更好地理解前述
技术实现思路
以及说明性实施例的以下详细描述。出于说明实施例的目的,图式中展示实施例的实例构造;然而,所述实施例不限于所揭示的特定方法和工具。在图式中:图1是其中可产生且使用个人化带宽扩展的示范性系统的框图;图2是用于个人化带宽扩展的训练的方法的实施方案的操作流程;图3是执行个人化带宽扩展的方法的实施方案的操作流程;图4是用于个人化带宽扩展的训练的方法的另一实施方案的操作流程;图5是用于个人化带宽扩展的训练的方法的另一实施方案的操作流程;图6是用于个人化带宽扩展的训练的方法的另一实施方案的操作流程;图7是执行用于基于谱包络/激励的个人化带宽扩展的训练的方法的实施方案的操作流程;图8是可与基于谱包络/激励的个人化带宽扩展一起使用的实例映射表的图;图9是可与基于谱包络/激励的个人化带宽扩展一起使用的另一实例映射表的图;图10是执行基于谱包络/激励的个人化带宽扩展的方法的实施方案的操作流程;图11是实例移动台的图;以及图12展示示范性计算环境。【具体实施方式】以下参考且并入有图式的详细说明描述且图解说明一或多个具体实施例。并非为了限制而是仅为了举例说明和教示而提供的这些实施例是以充足的细节展示和描述,以使所属领域的技术人员能够实践所主张的内容。因此,出于简洁起见,所述描述可能省略所属领域的技术人员已知的某些信息。图1是其中可(基于说话者可导出信息)产生且用以从所接收窄带(NB)语音信号形成宽带(WB)语音信号的个人化带宽扩展的示范性系统100的框图。系统100可用以产生具有比对应所接收模拟信号的频率范围大的频率范围的模拟信号。因此,信号是否为宽带信号或窄带信号取决于其与另一者的关系。虽然本文所描述的实例和实施方案指代从NB语音信号产生WB语音信号,但本系统和方法并不限于此,因为本文所揭示的系统和方法可用于从语音信号的任何其它集合产生语音信号的任何集合,例如从超宽带(SWB)到WB或SffB 到 NB。如图所示,系统100包含可由发射方使用的近端台110,以及可由接收方使用的远端台150。近端台110和远端台150可各自为用于通信的装置,例如移动台或计算装置。相对于图11描述实例移动台800,且相对于图12描述实例计算装置900。近端台110和远端台150可经由一或多个发射通道145通信。所述通信可包括从近端台I1到远端台150发射对应于说话者的语音发声105 (话音数据)的窄带版本的窄带语音信号。远端台150可使用对说话者训练(即,基于说话者可导出信息)以产生且输出说话者的语音发声105的对应宽带版本的模型163。如在此进一步所描述,取决于实施方案,模型123、163可经在近端台110或远端台150训练、产生且存储。因此,语音发声105和经训练模型123、163或数据(取决于实施方案)可经由一或多个发射通道145发射。更确切地说,发射器125根据(例如)一或多个电信发射标准将说话者的语音发声105 (话音数据)转换为原始语音发声105的窄带版本以用于发射。原始语音发声的窄带版本和经训练的模型或数据的发射可大体上以同时方式发生或(例如)可在发射过程期间在单独的时间发生。适合于在此实例中以及在下文阐述的实例中使用的发射信道包含电话网信道、无线蜂窝式网络信道、无线对讲机系统、有线网络或类似物。在此些发射系统中使用的窄带语音信号可限于300HZ-3.4kHz的带宽,其对应于用以使用全球移动通信系统(GSM)网络发射语音信号的带宽。取决于实施方案,近端台110可包括训练模块115、可存储一或多个经训练模型123的存储装置120 (例如,存储器)、发射器125、特征提取模块130以及语音合成器135。类似地但不相同地,取决于实施方案,远端台150可包括训练模块155、可存储一或多个经训练模型163的存储装置160 (例如,存储器)、接收器165、特征提取模块170以及语音合成器175。在一些实施方案中,可不需要或使用近端台110处的语音合成器135。举例来说,在使用仅从近端台110中的WB输入的特征域比较机制的实施方案中,可不产生真实语音且因此可不需要或使用语音合成器135。在此情况下(其使用特征域相似性比较来计算每一现有条目与输入之间的相似性),将模型和特征(例如NB特征)发送到远端台150以使得WB语音可在远端台150处合成。然而,在使用“按合成分析”机制以通过比较实际WB输入与合成WB输入而学习模型的实施方案中,可使用语音合成器135。此类型的实施方案使用合成语音信号域相似性比较来计算每一现有条目与输入之间的相似性。在近端台110处从近端台110的用户接收语音发声105。语音发声105用以提供个人化带宽扩展,其中用于带宽扩展的模型是对每一特定用户个人化(例如,定制)。在一实施方案中,执行训练阶段以产生对用户个人化的带宽扩展模型(在本文中也被称作“模型”)。可使用训练模块115在近端台110处或使用训练模块155在远端台150处执行训练阶段。由训练模块115产生的个人化带宽扩展模型123可存储在存储装置120中,且由训练模块155产生的模型163可存储在存储装置160中。存储装置120、160可存储一个以上模型(例如,对不同用户个人化)且可呈例如数据库的形式。取决于实施方案,近端台110和/或远端台150可包括特征提取模块(例如,分别为本文档来自技高网
...
个人化带宽扩展

【技术保护点】
一种用于带宽扩展的方法,其包括:以所识别说话者的数据产生带宽扩展模型;以及使用所述带宽扩展模型对包含所述所识别说话者的窄带呼叫执行带宽扩展。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:金莱轩刘尚忆辛钟元
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1