提高语音处理系统的本底噪声的方法以及语音处理系统技术方案

技术编号:3044638 阅读:167 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种语音处理系统,其用于使用人工生成的白噪声来改善与启用语音的系统的用户体验。所述系统可以包括音响环境,所述音响环境包括至少一个扩音器和至少一个扬声器、白噪声发生器、白噪声去除引擎和语音处理系统。所述白噪声发生器可以被配置以生成将要在所述音响环境中可听地呈现的白噪声。可以在语音输入中捕获该白噪声,并且所述白噪声去除引擎可以对所述输入进行数字预处理以去除白噪声成分。预处理的输入可以由所述语音处理系统进行处理,并且所述语音处理系统可以基于所接收到的输入创建语音输出。

【技术实现步骤摘要】

本专利技术涉及语音处理领域,并且更特别地,涉及通过使用人工生成的白噪声来改善与启用语音的系统(speech-enabled system )的交互式体验。
技术介绍
在嘈杂的环境中使用自动启用语音的系统常常出问题。由于背景噪声, 试图收听自动生成的语音输出的用户可能难以听到或难以专心于该语音输 出。也就是说,启用语音的系统用户易于被附近的对话和声音干扰,这导 致与启用语音的系统的交互式体验相对地不令人满意。诸如声学上用墙隔开区域的环境解决方案可能费用高昂或者可能由于 配置细节而不可能实现。例如,声学屏蔽启用语音的ATM机器可能费用 高昂,与此同时,试图隔离接近于启用语音的移动电话的环境也可能由于 设备移动性而不可能实现。另一种可能的解决方案是增加语音输出的音量,但其有很多缺点。首 先,其会增加环境的噪声级(noise level),这可能使得附近的个体随着该 音量增加而成比例地增加其自己的对话音量,而导致在增加的噪声级上的 原有问题。其次,筒单地提高启用语音的系统的音量可能导致干涉 (barge-in)检测问题和/或多变的有效音量控制。另外,当进行动态音量 调整时,语音识别过程可能由于环境变得嘈杂和安静而受到多变的音量级 的牵制。
技术实现思路
本专利技术提供了一种解决方案,该解决方案为在其中发生语音处理的声学环境人工生成白噪声,从而有目的地提高声学环境的本底噪声(noise floor)。所逸人工生成的白噪声可以通过压过背景噪声来改善用户的体验。 可以去除对应于白噪声信号的成分的输入语音信号的成分,这导致了仅含 有由语音处理系统处理的语音输入的干净信号(clean signal)。值得注意 的是,去除与所生成的白噪声关联的输入成分可以确保在所述声学环境中 呈现的白噪声不对语音识别操作产生不利的影响。可以依照与文中所呈现的资料一致的许多方面来实现本专利技术。例如, 本专利技术的一方面可以包括一种用于使用人工生成的白噪声来改善交互式体 验的语音处理系统。所述系统可以包括音响环境(audible environment), 所述音响环境包括至少一个扩音器和至少一个扬声器、白噪声发生器、白 噪声去除引擎,以及语音处理系统。所述白噪声发生器可以被设置以生成 将要在所述音响环境中可听地呈现的白噪声。可以在语音输入中捕获该白 噪声,并且所述白噪声去除引擎可以对所述输入进行数字预处理以去除白 噪声成分。预处理的输入可以由所述语音处理系统进行处理,并且所述语 音处理系统可以基于所接收到的输入创建语音输出。本专利技术的另 一方面可以包括一种用于使用人工生成的白噪声来提高与 语音处理系统相关联的声学环境的本底噪声的方法。可以在所述声学环境 中于可配置的音量级上呈现人工生成的白噪声以建立本底噪声。所述系统 可以从所述声学环境接收可听语音输入。可以数字处理该输入以去除所述 人工生成的白噪声。所述语音处理系统可以接收经处理的输入,并且可以 基于所接收到的输入生成人工生成的语音输出。可以在所述声学环境中可 听地呈现所iiA工生成的语音输出。本专利技术的又一方面可以包括一种用于使用人工生成的白噪声来改善与 语音处理系统的用户体验的方法。所述方法可以开始于在所建立的音量级 上将白噪声引入声学环境中。可以在声学输出中可听地呈现自动生成的语 音输出。可以从所述声学环境捕获语音输入。可以从所捕获的输入中去除 所述白噪声,从而产生干净的语音输入(clean speech input)。可以将所 述千净的语音输入转换成文本。应当注意,可以将本专利技术的各方面实现为用于控制计算设备实现文中 所描述的功能的程序,或者用于使计算设备能够进行对应于文中所公开的 步骤的过程的程序。可以通过在磁盘、光盘、半导体存储器或者任何其它 的记录介质中存储程序来提供该程序。还可以将所述程序提供为通过载波 传送的数字编码信号。所描述的程序可以是单个程序,或者可以实现为多 个子程序,其每一个在单个计算设备内交互或者跨网络空间以分布式方式 交互。还应当注意,文中所详述的方法还可以是响应于服务请求至少部分地 通过服务代理和/或服务代理所操纵的机器所实现的方法。附图说明附图中示出了当前优选的实施例,然而可以理解,本专利技术并不限于所示出的精确装配和手段,附图中图l是依照文中所公开的专利技术装配的实施例,人工生成白噪声以改善 与启用语音的自动系统的用户体验的系统的示意图2是依照文中所公开的专利技术装配的实施例,使用人工生成的白噪声 为语音处理环境建立本底噪声的方法的流程图;以及图3是依照文中所公开的专利技术装配的实施例的方法的流程图,在该方 法中,服务代理可以配置语音处理系统来生成白噪声。具体实施例方式图1是系统100的示意图,依照文中所公开的专利技术装配的实施例,系 统100人工生成白噪声以改善与启用语音的自动系统的用户体验。在系统 100中,用户110可以尝试在含有一定量的环境噪声的声学环境105中使 用语音处理系统120。例如,用户110可以在播放广播的汽车内部使用启 用话音的移动电话。声学环境105可以含有用户110、扩音器115以及扬声器117和119。 扩音器115可以视情况检测声学环境105的环境噪声级140,并且将这些级别传送给语音处理系统120。收到该信息可以使得语音处理系统120设 置白噪声发生器130的噪声级142。在可选的实施例中,语音处理系统120可以不能配置白噪声发生器130 的噪声级;可以独立于语音处理系统将所生成的白噪声设置成固定级别并 且对其进行维护。例如,白噪声发生器130可以是在商店中4番放背景音乐 的音响系统,其中,商店人员会控制音乐音量而不是顾客的移动电话的语 音处理系统。在另一例子中,白噪声发生器130可以在近乎不变的音量上 产生相对一致的声音。白噪声发生器130然后可以生成噪声信号144并且将该噪声144传输 至产生噪声输出145的扬声器117。用户110可以提供可以由扩音器115 作为嘈杂的输入150而捕获的话语147。应当注意,扩音器115所捕 获的嘈杂的输入150含有用户110所说的话语147以及噪声输出145。扩音器115可以将所捕获的嘈杂的输入150传递至白噪声去除引 擎135。白噪声去除引擎135可以是用于从所接收到的输入信号中去除白 噪声的机制。另外,白噪声去除引擎135可以接收由白噪声发生器130所 生成的噪声144。白噪声去除引擎135可以从嘈杂的输入150中去除 噪声144成分,以便产生要发送至语音处理系统120的干净的输入152 信号。在收到干净的输入152时,语音处理系统120可以进行与该输入 关联的一组程序性动作。这样的处理可以产生语音154信号,其可以通过 扬声器119作为语音输出156传送至用户110。应当理解,系统100的各种组件可以出现在各种配置中。在一种这样 的配置中,可以将项目115、 117、 119、 120、 130和135集成到诸如启用 语音的多媒体计算机这样的单个设备中。在可选的配置中,语音处理系统 120可以是诸如Web门户应用这样的网络元素,而项目115、 117、 119、 130和135可以驻留于诸如个人计算机这样的客户设备。此外,单个扬声 器117可以代替分离元件用于传送噪声输出145和语音输出156这二者本文档来自技高网...

【技术保护点】
一种语音处理系统,其包括:音响环境,所述音响环境包括用于接收语音输入的至少一个扩音器以及用于可听地呈现语音输出的至少一个扬声器;白噪声发生器,所述白噪声发生器被配置以生成在所述音响环境中可听地呈现的白噪声;白噪声去除引擎,所述白噪声去除引擎被配置以便对所述扩音器所捕获的语音输入进行数字预处理以及去除包括在所捕获的输入中的白噪声成分;以及语音处理系统,所述语音处理系统用于处理由所述白噪声去除引擎预处理后的语音输入,以及用于创建语音输出。

【技术特征摘要】
US 2006-12-18 11/612,1701.一种语音处理系统,其包括音响环境,所述音响环境包括用于接收语音输入的至少一个扩音器以及用于可听地呈现语音输出的至少一个扬声器;白噪声发生器,所述白噪声发生器被配置以生成在所述音响环境中可听地呈现的白噪声;白噪声去除引擎,所述白噪声去除引擎被配置以便对所述扩音器所捕获的语音输入进行数字预处理以及去除包括在所捕获的输入中的白噪声成分;以及语音处理系统,所述语音处理系统用于处理由所述白噪声去除引擎预处理后的语音输入,以及用于创建语音输出。2. 根据权利要求l的语音处理系统,其中所述白噪声去除引擎接收由 所述白噪声发生器所生成的信号的输入,其中,从所述语音输入中减去所 接收到的信号以便去除所述白噪声成分。3. 根据权利要求2的语音处理系统,其中所述白噪声去除引擎被配置 以进行至少一个变换,以便解决所述扩音器所接收到的白噪声成分与所接 收到的信号的白噪声之间在听觉上的变化。4. 根据权利要求l的语音处理系统,其中在所述音响环境中呈现的白 噪声的音量级是可配置的。5. 根据权利要求4的语音处理系统,其中在近乎不变的音量上可听地 呈现所述白噪声。6. 根据权利要求5的语音处理系统,其中所述白噪声的可配置的音量 级为所述语音处理系统建立了本底音量。7. 根据权利要求4的语音处理系统,其中所述白噪声的音量级可由所 述语音处理系统控制。8. 根据权利要求4的语音处理系统,其中与用于可听地呈现所述白噪 声的扬声器不同的扬声器用于可听地呈现所述语音输出,并且其中所述语音输出的音量级在程序上链接于所述白噪声的音量级。9. 根据权利要求l的语音处理系统,其中所述白噪声发生器、所述白 噪声去除引擎,以及所述语音处理系统驻留于相同的计算设备内,其中所 述扬声器和所述扩音器在通信上链接至所述计算设备。10. —种用于使用人工生成的白噪声来提高语音处理系统的本底噪 声的方法,其包括在可配置的音量级上可听地呈现人工生成的噪声,以便为声学环境建 立本底噪音;接收含有从所述声学环境获得的语音的可听输入;数字处理含有语音的输入,以便从所述输入中去除所i!A工生成的噪 声;以及向所...

【专利技术属性】
技术研发人员:BD麦茨D达梅斯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利