上下文感知语音可懂度增强制造技术

技术编号：33234142 阅读：24 留言：0更新日期：2022-04-27 17:32

一种方法包括：用麦克风检测环境中的噪声以产生噪声信号；接收要通过扬声器播放到环境中的语音信号；基于麦克风的麦克风传递函数执行噪声信号的多频带校正，以产生校正后的噪声信号；基于扬声器的扬声器传递函数执行语音信号的多频带校正，以产生校正后的语音信号；以及基于校正后的噪声信号和校正后的语音信号计算多频带语音可懂度结果。计算多频带语音可懂度结果。计算多频带语音可懂度结果。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】上下文感知语音可懂度增强
[0001]优先权声明
[0002]本申请要求2019年9月11日提交的美国临时申请No.62/898,977的优先权，其通过引用整体并入本文。

[0003]本公开涉及语音可懂度处理。

技术介绍

[0004]诸如人工智能(Al)喇叭、移动电话、电话会议、物联网(IoT)设备等的语音回放设备经常用于包括高等级背景噪声的声学环境中。语音回放设备播放的语音可能被背景噪声掩盖，导致语音可懂度降低。有许多提高语音可懂度的技术可用。其中一些技术还利用噪声捕获设备来增强嘈杂环境中的语音可懂度。然而，这些技术没有指定和解决与特定于实现方式的限制相关联的实际挑战，诸如回放设备的物理限制、噪声捕获设备的物理限制、语音可懂度处理的信号净空以及长期语音特性。
附图说明
[0005]图1是在其中可以实现针对语音可懂度处理的实施例的示例系统的高级框图。
[0006]图2是在图1的系统中实现的示例语音可懂度处理器(VIP)和相关联的语音和噪声处理的框图。
[0007]图3示出了语音可懂度指数(SII)的频带
‑
重要性函数的示例曲线图。
[0008]图4示出了两个不同扬声器的示例扬声器频率响应。
[0009]图5是示例理想化麦克风频率响应和示例理想化扬声器频率响应，以及基于这两个频率响应之间的相互关系确定的各种频率分析范围的频率曲线图。
[0010]图6示出了语音信号的短片段及其对应频谱的曲线图。
[0011]图7示出了语音信...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：用麦克风检测环境中的噪声以产生噪声信号；接收要通过扬声器播放到所述环境中的语音信号；基于所述麦克风的麦克风传递函数和所述扬声器的扬声器传递函数之间的关系，确定用于多频带语音可懂度计算的频率分析区域；和基于所述噪声信号和所述语音信号，在所述频率分析区域上计算多频带语音可懂度结果。2.如权利要求1所述的方法，还包括：使用所述多频带语音可懂度结果增强所述语音信号的可懂度。3.如权利要求1所述的方法，其中：所述确定包括将所述麦克风传递函数的麦克风通带和所述扬声器传递函数的扬声器通带相重叠的重叠通带确定为所述频率分析区域；并且所述计算包括在限于所述重叠通带的语音分析带上计算每频带语音可懂度值。4.如权利要求3所述的方法，其中，所述计算还包括计算(i)在限于所述重叠通带的语音分析带上基于所述语音信号的语音功率与(ii)在所述麦克风通带上基于所述噪声信号的噪声功率的全局语音噪声比。5.如权利要求3所述的方法，还包括：确定所述扬声器通带的起始频率是否大于所述麦克风通带的起始频率；以及当所述扬声器通带的起始频率更大时，在低于所述麦克风通带的起始频率的频带内衰减所述语音信号。6.如权利要求3所述的方法，其中，所述确定包括：识别分别定义所述麦克风通带和所述扬声器通带的起始频率和停止频率；以及将所述重叠通带计算为从最大起始频率延伸到最小停止频率的通带。7.如权利要求1所述的方法，其中：所述计算多频带语音可懂度结果包括计算每频带语音可懂度值和全局语音噪声比。8.如权利要求1所述的方法，其中，所述计算多频带语音可懂度结果包括：基于所述语音信号和所述噪声信号的短/中长度片段执行多频带语音可懂度分析，以产生短期语音可懂度结果；以及基于所述语音信号和所述噪声信号的比所述短/中长度片段长的长片段执行多频带语音可懂度分析，以产生长期语音可懂度结果。9.如权利要求1所述的方法，还包括：基于所述麦克风传递函数执行所述噪声信号的多频带校正，以产生校正后的噪声信号；以及基于所述扬声器传递函数执行所述语音信号的多频带校正，以产生校正后的语音信号，其中所述计算包括基于所述校正后的噪声信号和所述校正后的语音信号，在所述频率分析区域上计算所述多频带语音可懂度结果。10.如权利要求9所述的方法，还包括：在执行所述噪声信号的多频带校正之前，基于所述麦克风的灵敏度执行所述噪声信号
的数字到声学等级转换；以及在执行所述语音信号的多频带校正之前，基于所述扬声器的灵敏度执行所述语音信号的数字到声学等级转换。11.一种装置，包括：麦克风，用于检测环境中的噪声以产生噪声信号；扬声器，用于将语音信号播放到所述环境中；以及控制器，耦合到所述麦克风和所述扬声器，并且被配置为执行：基于所述麦克风的麦克风传递函数对所述噪声信号的多频带校正，以产生校正后的噪声信号；基于所述扬声器的扬声器传递函数对所述语音信号的多频带校正，以产生校正后的语音信号；基于所述校正后的噪声信号和所述校正后的语音信号计算多频带语音可懂度结果；基于所述多频带语音可懂度结果计算多频带增...

【专利技术属性】
技术研发人员：D，
申请(专利权)人：DTS公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人