使用一键通(PTT)音频属性的音频处理系统和方法技术方案

技术编号:22267153 阅读:83 留言:0更新日期:2019-10-10 17:24
本发明专利技术题为“使用一键通(PTT)音频属性的音频处理系统和方法”。本发明专利技术提供了用于使用一键通(PTT)音频属性来区分话语的音频处理的方法和系统。该系统接收包括两个或更多个话语的音频流。该系统包括控制模块,该控制模块包括处理器和存储器,该控制模块被配置为:接收音频流;将音频流实时存储在存储器中的当前缓冲区中;将音频流分成相等大小的多个时间段;以及针对该多个时间段中的每个时间段,使用一键通(PTT)音频属性处理该时间段以查找PTT事件,该PTT事件被定义为释放PTT按钮;并且在识别PTT事件时,通过以下方式响应所识别的PTT事件:(i)关闭当前缓冲区,(ii)打开新的数据存储位置,以及(iii)将新的数据存储位置定义为当前缓冲区。

Audio Processing System and Method Using PTT Audio Attribute

【技术实现步骤摘要】
使用一键通(PTT)音频属性的音频处理系统和方法
本专利技术整体涉及音频处理系统,并且更具体地,涉及使用一键通(PTT)音频属性识别话语的音频处理方法和系统。
技术介绍
在一些场景中,空中交通管制(ATC)与飞行员之间的通信可能是低效的。示例性场景包括嘈杂的环境、口音、干扰和其他驾驶舱噪音。在这些情况下,飞行员可能不得不要求空中交通管制(ATC)的控制器再次重复命令和信息,以明晰化任何混淆。因此,期望有助于飞行员理解通信无线电承载的ATC音频内容的实时转录辅助装置。例如,识别ATC消息中参考飞行器尾号的转录辅助装置将很快允许飞行员区分用于本机的ATC消息和用于相邻交通的ATC消息。此类转录辅助装置可增加间隙的确定性,帮助记忆,并帮助飞行员准确遵守ATC指令。然而,ATC转录系统可在从飞行器音频面板轻击的通信无线电信道上进行操作。由于音频面板用于各种语音通信,通信无线电信道可将ATC通信与各种音频信号混合,诸如交通飞行员会话、副驾驶、对讲机、摩尔斯电码、来自驾驶舱系统的听觉警报/警告、ATIS等。这些技术挑战使得难以实现可靠且准确的实时ATC转录。因此,期望改进的音频处理方法和系统。另外,根据随后的具体实施方式和所附权利要求,结合附图和
技术介绍
,本公开的其他期望的特征和特性将变得显而易见。
技术实现思路

技术实现思路
提供用于以简化的形式来描述一系列概念,这些概念在具体实施方式中被进一步描述。本
技术实现思路
并非旨在识别要求保护的主题的关键特征或本质特征,也并非旨在用于辅助确定所要求保护的主题的范围。提供了一种用于音频处理的方法。该方法在控制模块中执行,并且包括以下步骤:将定义为当前缓冲区的数据存储位置初始化;从音频面板接收音频流;响应于接收音频流,重复以下步骤:将音频流实时存储在当前缓冲区中;通过基于(PTT)音频属性处理音频流来识别一键通(PTT)事件,PTT事件被定义为确定释放PTT按钮;以及通过以下方式响应所识别的PTT事件:(i)关闭当前缓冲区,(ii)打开新的数据存储位置,以及(iii)将新的数据存储位置定义为当前缓冲区。在另一方面,提供了一种用于音频处理的系统。该系统包括:音频面板,该音频面板用于提供包括两个或更多个话语的音频流;和控制模块,该控制模块包括处理器和存储器,该控制模块被配置为:接收音频流;将音频流实时存储在存储器的当前缓冲区中;将音频流分成相等大小的多个时间段;以及对于多个时间段中的每个时间段,使用一键通(PTT)音频属性处理时间段以查找PTT事件,PTT事件被定义为释放PTT按钮;以及在识别PTT事件时,通过以下方式响应所识别的PTT事件:(i)关闭当前缓冲区,(ii)打开新的数据存储位置,以及(iii)将新的数据存储位置定义为当前缓冲区。还提供了一种空中交通管制(ATC)转录模块。ATC转录模块包括:处理器和存储器,该处理器被配置为:接收包括ATC话语的音频流;将音频流实时存储在存储器的当前缓冲区中;将音频流分成相等大小的多个时间段;以及对于多个时间段中的每个时间段,通过在时间段上执行快速傅立叶变换(FFT)和复数模量来生成复数模量(CM)段;使用一键通(PTT)音频属性处理CM段以查找PTT事件,PTT被定义为释放PTT按钮;以及在识别PTT事件时,通过以下方式来响应所识别的PTT事件:(i)关闭当前缓冲区,(ii)在存储器中打开新的数据存储位置,以及(iii)将新的数据存储位置定义为当前缓冲区。另外,根据随后的具体实施方式和所附权利要求,结合附图和前述
技术介绍
,该系统和方法的其他期望的特征和特性将变得显而易见。附图说明下文将结合以下附图描述本专利技术,其中类似的数字表示类似的元件,并且图1是根据示例性实施方案的音频处理系统的框图;图2是根据示例性实施方案的用于音频处理系统的ATC转录模块的框图;图3是根据示例性实施方案的用于音频处理的方法的流程图;并且图4是根据示例性实施方案的向图3中所示的方法提供更多细节的流程图。具体实施方式以下具体实施方式本质上仅是示例性的,并且不旨在限制主题的实施方案或此类实施方案的应用和使用。如本文所用,字词“示例性的”是指“用作示例、实例或例证”。因此,本文中描述为“示例性的”的任何实施方案不一定理解为比其他实施方案优选或有利。本文描述的所有实施方案是被提供以使得本领域技术人员能够制造或使用本专利技术而不是限制由权利要求限定的本专利技术的范围的示例性实施方案。另外,不意图受前述
技术介绍
或以下具体实施方式中提出的任何理论的束缚。所公开的新型音频处理系统(图1,102)的示例性实施方案提供了技术上经改进的音频处理系统和方法,用于实时识别音频流(图1,107)内的话语。如本文所用,“实时”是能够与当前和瞬时互换的。预期音频流107是复杂的,即包括多个混合的模拟音频信号,每个音频信号来自不同的音频源。音频处理系统102采用这样的模型,其中按下一键通(PTT)按钮以开始话语,发生话语,然后在话语结束时释放PTT按钮(如本文所用,PTT事件被定义为释放PTT按钮的发生)。这样,音频处理系统102使用PTT事件来区分话语。如本文所用,“缓冲”意味着将数据存储在称为缓冲区的数据存储位置中。所公开的音频处理系统102通常在接收音频流时将所接收的音频流107作为数据实时缓冲。缓冲动作响应于PTT事件,使得两个PTT事件之间的音频流107的每个部分被存储或缓冲到新的缓冲区166中。因此,每个缓冲区166的内容对应于相应的单个话语。由音频处理系统102执行的程序(图2,162)以各种方式利用快速傅立叶变换(FFT),复数模量计算,以及与PTT设备的激活相关联的预定义音频属性库,该PTT设备用于识别PTT事件已经发生,并基于此通知音频流107的缓冲。下面更详细地描述所公开的音频处理系统102和方法。现在转到图1,在一个实施方案中,音频处理系统102(本文中也被称为“系统”102)通常位于移动平台100中。在各种实施方案中,移动平台100是飞行器,并且被称为飞行器100。音频处理系统102包含空中交通管制(ATC)转录模块104(本文中也被称为“控制模块”104)。控制模块104可与预先存在的移动平台管理系统、航空电子系统、驾驶舱显示系统(CDS)、飞行控制系统(FCS)、飞行器飞行管理系统(FMS)或电子飞行包(EFB)分离或集成在其中。控制模块104被配置为接收和处理音频流107。在各种实施方案中,音频流107由音频面板106提供。控制模块104可另外可操作地耦接到用户界面116和数据库114。在操作期间,控制模块104经由信号109选择性地传输缓冲区166(图2)内容,以供外部后处理系统118进一步处理和使用。下面更详细地描述这些功能块及其相互作用。在各种实施方案中,音频面板106基于从各种音频输入源108接收的输入来生成音频流107。在一些实施方案中,音频面板106的输入已被信号处理并准备好供音频面板106使用。在其他实施方案中,音频面板106已与其集成了通信系统,该通信系统被配置为接收各种输入信号并相应地对其进行信号处理,以供音频面板106使用。在那些实施方案中,集成通信系统支持一个或多个外部音频输入源112和音频面板106之间的通信,以及来自机载音频输入源110和音频面板本文档来自技高网
...

【技术保护点】
1.一种用于音频处理的方法,包括以下步骤:在控制模块处,将被定义为当前缓冲区的数据存储位置初始化;从音频面板接收音频流;响应于接收所述音频流,重复以下步骤:将所述音频流实时存储在所述当前缓冲区中;通过基于一键通(PTT)音频属性处理所述音频流来识别PTT事件,PTT事件被定义为确定释放PTT按钮;以及通过以下方式响应所识别的PTT事件:(i)关闭所述当前缓冲区,(ii)打开新的数据存储位置,以及(iii)将所述新的数据存储位置定义为所述当前缓冲区。

【技术特征摘要】
2018.03.20 US 15/926,1151.一种用于音频处理的方法,包括以下步骤:在控制模块处,将被定义为当前缓冲区的数据存储位置初始化;从音频面板接收音频流;响应于接收所述音频流,重复以下步骤:将所述音频流实时存储在所述当前缓冲区中;通过基于一键通(PTT)音频属性处理所述音频流来识别PTT事件,PTT事件被定义为确定释放PTT按钮;以及通过以下方式响应所识别的PTT事件:(i)关闭所述当前缓冲区,(ii)打开新的数据存储位置,以及(iii)将所述新的数据存储位置定义为所述当前缓冲区。2.根据权利要求1所述的方法,其中所述音频流包括来自至少两个不同源的混合的音频信号,并且对所述音频流进行信号处理包括将所述音频流分成相等大小的多个时间段。3.根据权利要求2所述的方法,其中对所述音频流进行信号处理还包括:针对所述多个时间段中的每个时间段,通过在所述时间段上执行快速傅立叶变换(FFT)和复数模量来生成复数模量(CM)段。4.根据权利要求3所述的方法,其中识别PTT事件还包括:针对每个CM段,将所述CM段的功率谱密度(PSD)与第一阈值进行比较;以及当所述CM段的所述PSD超过所述第一阈值时,识别CM段中的可疑PTT事件。5.根据权利要求4所述的方法,其中识别PTT事件还包括:响应于识别CM段中的可疑PTT事件,将所述CM段与PTT库中的音频属性进行互相关;以及确定所述互相关满足预定义的准确度阈值。6.一种用于音频处理的系统,包括:音频面板,所述音频面板用于提供包括两个...

【专利技术属性】
技术研发人员:西瓦拉曼·萨普塔里什瓦桑塔·塞尔维·保罗拉吉
申请(专利权)人:霍尼韦尔国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1