【技术实现步骤摘要】
【国外来华专利技术】采用上采样的双端讲话检测
[0001]相关申请的交叉引用
[0002]本申请要求2021年2月25日提交的美国临时申请第63/153,522号和2020年3月23日提交的美国临时申请第62/993,136号的优先权,这两个申请均通过引用并入本文。
专利
[0003]本公开涉及音频处理,尤其涉及双端讲话检测。
技术介绍
[0004]除非本文另有说明,否则本节中描述的方法不是本申请中权利要求的现有技术,并且不因为被包含在本节中而被认为是现有技术。
[0005]诸如音频会议系统的电信设备通常包括扬声器和麦克风两者。通信中的双方可以被称为近端方和远端方。近端方靠近第一电信设备,而远端方位于与近端方不同的位置,并且使用第二电信设备经由有线或无线电信网络进行通信。近端设备的麦克风不仅捕获近端方的语音,还可以捕获已经从近端的扬声器输出的远端方的语音。麦克风捕获的扬声器输出通常称为回声。近端电信设备通常包括回声管理系统,用于在将在近端捕获的音频传输到远端之前减少回声。
[0006]术语“双端讲话(double talk)”通常用来描述对话双方同时说话的情况。双方都认为双端讲话令人讨厌,一般一方会停止谈话。为了提高通信质量,从而增强用户体验,具有能够在双端讲话发生时适当地响应的设备将是有利的。
技术实现思路
[0007]当双端讲话存在时,为了向正在发生双端讲话的远端提供听觉线索,希望将近端语音发送到远端,而不执行太多(或任何)回声减少。近端的电信设备可以包括双端讲话检测器,用于检测双端讲话 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的音频处理方法,该方法包括:接收第一音频信号,其中所述第一音频信号具有第一采样频率;对第一音频信号进行上采样以生成第二音频信号,其中第二音频信号具有大于第一采样频率的第二采样频率;由扬声器输出对应于第二音频信号的扬声器输出;由麦克风捕获第三音频信号,其中第三音频信号具有比第一采样频率大的第三采样频率;确定第三音频信号的信号功率;和当在大于第一采样频率的频带中确定了第三音频信号的信号功率时,检测到双端讲话。2.根据权利要求1所述的方法,进一步包括:当检测到双端讲话时,选择性地产生控制信号;和根据所述控制信号对所述第三音频信号执行回声管理。3.根据权利要求2所述的方法,其中执行回声管理包括:根据所述控制信号对所述第三音频信号执行回声消除,其中所述回声消除对所述第三音频信号执行线性衰减。4.根据权利要求2
‑
3中任一项所述的方法,其中执行回声管理包括:根据所述控制信号对所述第三音频信号执行回声抑制,其中所述回声抑制对所述第三音频信号的特定频带执行非线性衰减。5.根据权利要求1
‑
4中任一项所述的方法,其中所述第三音频信号包括本地音频和所述扬声器输出,其中所述本地音频对应于不同于所述扬声器输出的音频,并且其中所述本地音频不是由所述扬声器输出的,而是由所述麦克风捕获的。6.根据权利要求1
‑
5中任一项所述的方法,其中所述第一采样频率为8kHz,其中所述第二采样频率至少为16kHz,并且其中所述第三采样频率至少为16kHz。7.根据权利要求1
‑
6中任一项所述的方法,进一步包括:对第三音频信号进行下采样以生成第四音频信号,其中第四音频信号具有小于第三采样频率的第四采样频率;和将所述第四音频信号传输到远端设备。8.根据权利要求7所述的方法,其中所述第四采样频率和所述第一采样频率是相同的采样频率。9.根据权利要求1
‑
8中任一项所述的方法,其中,确定第三音频信号的信号功率并检测双端讲话包括:测量大于第一采样频率的频带中的第三音频信号的信号功率;跟踪大于第一采样频率的频带中的第三音频信号的背景噪声功率;和作为将大于第一采样频率的频带中的第三音频信号的信号功率与大于第一采样频率的频带中的第三音频信号的背景噪声功率进行比较的结果,检测到双端讲话。10.根据权利要求1
‑
8中任一项所述的方法,其中,确定第三音频信号的信号功率并检测双端讲话包括:测量大于第一采样频率的频带中的第三音频信号的信号功率;
跟踪大于第一采样频率的频带中的第三音频信号的背景噪声功率;测量第一音频信号的失真功率;和基于大于第一采样频率的频带中的第三音频信号的信号功率、大于第一采样频率的频带中的第三音频信号的背景噪声功率、以及第一音频信号的失真功率,检测双端讲话。11.根据权利要求10所述的方法,其中测量第一音频信号的失真功率包括:通过对第一音频信号执行带通滤波来生成滤波信号;测量滤波信号的信号功率;和通过对滤波信号的信号功率执行非线性调节来确定失真功率。12.一种存储计算机程序的非暂时性计算机可读介质,当由处理器执行时,该计算机程序控制装置执行包括根据权利要求1
‑
11中...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。