当前位置: 首页 > 专利查询>英特尔公司专利>正文

声学信号修改制造技术

技术编号:10387903 阅读:124 留言:0更新日期:2014-09-05 13:19
用于使用声学传递函数来修改由一个或多个麦克风提供的声学信号的系统和方法。声学传递函数可以部分地基于声学模型并且基于所确定的声学单元的位置来确定。

【技术实现步骤摘要】
【国外来华专利技术】声学信号修改
本专利技术公开总体上涉及声学信号,并且具体地涉及对声学信号进行修改。
技术介绍
语音识别技术可以根据由通过声音启动的麦克风收集的声学信号来生成文本。语音识别可以依赖于语音识别引擎,所述语音识别引擎通过应用已知的算法或模型(例如,隐式马尔科夫模型(HMM))来解析来自一个或多个麦克风的声学信号并且将信号解析为词。这种技术被越来越多地运用于各种用途,这些用途包括电子听写、话音命令识别、以及基于电话的交互式话音应答客户服务引擎。交通工具环境尤其受益于语音识别技术,因为对于交通工具的驾驶者而言,令人满意的是以免提的方式来提供指令并且控制交通工具以及其他外围设备,例如,借助于使用由语音识别引擎识别的话音命令。因此,在汽车应用中部署语音识别技术可以提供增强的道路安全和改善的驾驶体验。语音识别技术的性能随着更快的处理器和改善的语音识别方法的部署而得到提高。尤其是,在由语音识别引擎来识别词的准确性方面已经有所改进。换句话说,在针对语音识别的基于准确性的度量(例如,词错误率(WER))方面已经有所改进。尽管在语音识别技术的性能方面有了提高和进步,但是在某些环境(例如,交通工具环境)中,语音识别的准确性可能仍然是相对容易出错的。例如,语音识别引擎在相对嘈杂的环境或封闭的空间(例如,交通工具驾驶舱)中可能是不理想的或者降低了级别的,在这种环境中,声波可能经由多个路径并且伴随着其他噪音(例如,引擎噪音、路面噪音等)的存在而到达麦克风。【附图说明】现在参考附图,所述附图不一定是按照比例绘制的,并且其中:图1是示出了根据本专利技术公开的实施例的与交通工具相关联的用于修改声学信号的示例性方法的简化图。图2是示出了根据本专利技术公开的实施例的将修改的声学信号提供给语音识别引擎的示例性方法的流程图。图3是示出了根据本专利技术公开的实施例的图1的交通工具的示例性驾驶舱的简化示意性俯视图,其中,可以生成示例性声学模型。图4是示出了根据本专利技术公开的实施例的图3的示例性驾驶舱的简化示意性侧视图,其中,可以生成示例性声学模型。图5是示出了根据本专利技术公开的实施例的图3的示例性驾驶舱的简化示意性俯视图,其中,示例性音频单元可以生成声音并且产生来自一个或多个麦克风的声学信号。图6是示出了根据本专利技术公开的实施例的用于修改声学信号的示例性系统的简化框图。图7是示出了根据本专利技术公开的实施例的被追踪以修改声学信号的示例性音频单元的简化示意图。图8是示出了根据本专利技术公开的实施例的图3的驾驶舱的简化示意图,其中,示例性的声音路径被从音频单元发送到一个或多个麦克风。图9是示出了根据本专利技术公开的实施例的音频传递函数的示例性估计的简化框图。图10是示出了根据本专利技术公开的实施例的修改来自一个或多个麦克风中的每一个的音频信号并且将示例性的修改的音频信号提供给语音识别引擎的示意图。【具体实施方式】在下文中参考附图来更充分地描述本专利技术公开的实施例,附图中示出了本专利技术公开的实施例。然而,本专利技术可以以许多不同的形式来具体实现,并且不应该被解释为被限制于本文中所阐述的实施例;相反,提供这些实施例以便使本专利技术公开是全面的并且完整的,并且将本专利技术的范围充分地传达给本领域的技术人员。贯穿全文,相同的附图标记指代相同的元件。本专利技术公开的实施例可以提供用于修改与在一个或多个麦克风处生成的声音相对应的声学信号的系统、方法、装置。在一个方面中,可以将麦克风提供于封闭的体积或环境中,所述封闭的体积或环境可能易于产生声学回声和/或可能是吵杂的声学环境,例如,交通工具的驾驶舱。可以对已修改的来自一个或多个麦克风的音频信号进行组合并且将其提供给语音识别引擎,以使得能够有改善的语音识别用于各种应用,包括在交通工具中对话音命令的识别或文本输入。与由麦克风生成的未修改的音频信号相比,已修改的音频信号可以较少地被回声或噪音所污染。在一个方面中,提供给语音识别引擎的已修改的音频信号可以导致相对较低的词错误率(WER)。本专利技术公开的实施例可以进一步要求部分地基于声音产生单元的位置来确定针对一个或多个麦克风中的每一个麦克风的声学传递函数。另外,体积或环境(例如,交通工具的驾驶舱)的声学模型可以被用于确定一个或多个麦克风中的每一个麦克风的声学传递函数。在一个方面中,体积或环境的声学模型可以由第三方(例如,交通工具的制造商或合适的服务提供商)来确定。现在将参考附图来描述本专利技术公开的示例性实施例。现在参考图1,讨论了根据本专利技术公开的实施例的用于解析交通工具102中的声学信号的示例性方法100。出于本讨论的目的,交通工具102可以包括小汽车、卡车、轻型卡车、重型卡车、皮卡、小型货车、跨界(crossover)车、有篷货车、商务车、私家车、牵引拖车、飞机、喷气式飞机、直升飞机、太空交通工具、水运工具、或任何其他具有相对封闭的驾驶舱的合适的交通工具,但不限于此。然而,应当意识到的是,本专利技术公开的实施例还可以被应用于提供了相对封闭区域的其他环境中。在框104处,确定交通工具102的三维(3-D)声学模型。在一个方面中,可以在由最终用户购买交通工具102之前,确定交通工具的声学模型。例如,在交通工具102被提供给交通工具代理商并且随后由最终用户购买之前,交通工具的制造商或服务提供商(例如,代表制造商的服务提供商)可以确定交通工具102的声学模型。因此,在一个方面中,交通工具102的终端客户并不需要确定交通工具102的三维声学模型。交通工具102的三维声学模型可以存储在与交通工具102相关联的电子存储器中。特别地,电子存储器可以被提供于用于修改与交通工具102相关联的音频信号的系统中。在框106处,三维声学模型可以被用于解析或修改声学信号。可以基于在交通工具102内产生的压缩波或声音来生成声学信号。例如,可以通过由在交通工具内(例如由交通工具102的驾驶员或由交通工具102的驾驶舱中的另一用户)生成的声音启动的麦克风来生成声学信号。因此,本质上,生成并提供了交通工具102的声学模型,其可以被用于某些实施例中,以更正确且精准地解析在交通工具102中生成的声音。在某些方面中,可以由语音识别引擎来解析声学信号,从而提供语音到文本功能。现在将参考图2来说明使用三维声学模型来解析音频信号的进一步的细节。根据本专利技术公开的实施例的将修改的声学信号提供给语音识别引擎的方法120可以包括:在框122处,生成至少一个声学模型,例如交通工具的三维声学模型,正如参考图1所描述的。在某些实施例中,可以由交通工具102的制造商来生成声学模型。在其他实施例中,可以由销售交通工具102的代理商来生成声学模型。在另外的实施例中,可以由最终用户(例如,交通工具的所有者或驾驶员)来生成声学模型。在一个方面中,可以针对由交通工具制造商制造的每个交通工具102来生成一个声学模型。在其他方面中,可以针对每种类型的交通工具来提供一个声学模型。例如,在框122处,可以为给特定的制造商、型号、年份、和/或装饰的所有交通工具提供同一个声学模型。在某些实施例中,声学模型可以包括与体积内的任何数量的相应空间位置相对应的声学传递函数,其中,在所述体积内产生声音并且修改所得到的声学信号。在一个方面中,可以在三维空间中定义空间位置,产生了三维声学模型。可选择地,可以在二维本文档来自技高网...

【技术保护点】
一种方法,包括:由一个或多个处理器来接收声学模型:监视至少一个声学单元的位置;至少部分地基于所述声学模型和所述至少一个声学单元的位置,由所述一个或多个处理器来确定与至少一个麦克风中的每一个麦克风相对应的相应的声学传递函数;从所述至少一个麦克风中的每一个麦克风接收声学信号;以及至少部分地基于相对应的声学传递函数,由一个或多个处理器来修改所接收的声学信号中的每一个声学信号。

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括: 由一个或多个处理器来接收声学模型: 监视至少一个声学单元的位置; 至少部分地基于所述声学模型和所述至少一个声学单元的位置,由所述一个或多个处理器来确定与至少一个麦克风中的每一个麦克风相对应的相应的声学传递函数; 从所述至少一个麦克风中的每一个麦克风接收声学信号;以及 至少部分地基于相对应的声学传递函数,由一个或多个处理器来修改所接收的声学信号中的每一个声学信号。2.如权利要求1所述的方法,其中,所述声学模型包括至少一个初始传递函数,所述至少一个初始传递函数中的每一个与至少一个预定的位置相对应。3.如权利要求1所述的方法,其中,所述至少一个声学单元是与个人相关联的唇部环状区。4.如权利要求1所述的方法,其中,监视所述至少一个声学单元的位置包括:使用图像传感器来对所述至少一个声学单元进行成像。5.如权利要求1所述的方法,其中,监视所述至少一个声学单元的位置包括:使用测距传感器来确定所述 至少一个声学单元与所述测距传感器之间的距离。6.如权利要求1所述的方法,其中,所述至少一个声学单元的位置被定义为三维空间中的点。7.如权利要求1所述的方法,其中,确定所述声学传递函数包括以下中的至少一个:(i)体积插值;(ii)体积外推;(iii) 二维插值;Qv) 二维外推;(V) —维插值;或(vi) 一维外推。8.如权利要求1所述的方法,其中,所述声学信号中的每一个是与由所述至少一个声学单元生成的声音相对应的电信号。9.如权利要求1所述的方法,其中,修改所述声学信号中的每一个包括:将所述声学信号中的每一个乘以它相对应的声学传递函数的反函数。10.如权利要求1所述的方法,进一步包括:将所修改的声学信号中的至少一个提供给语音识别引擎。11.如权利要求1所述的方法,进一步包括:由所述一个或多个处理器来确定所述声学模型。12.如权利要求11所述的方法,其中,确定所述声学模型包括:确定至少一个物理传递函数,每一个物理传递函数对应于相应的位置。13.如权利要求12所述的方法,其中,确定所述至少一个物理传递函数进一步包括:根据在所述相应的位置中的每一个位置处提供的声音来确定在...

【专利技术属性】
技术研发人员:D·L·格劳曼
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1