人声透传方法、装置、耳机、存储介质及程序产品制造方法及图纸

技术编号:37971890 阅读:21 留言:0更新日期:2023-06-30 09:47
本申请实施例公开了一种人声透传方法、装置、耳机、存储介质及程序产品,属于音频处理技术领域。该方法用于耳机,该方法包括:对采集到的外界音频信号进行人声识别;在识别出外界音频信号中包含人声信号的情况下,从外界音频信号中分离人声信号;对分离得到人声信号和降噪信号进行混音处理,得到混音信号,降噪信号用于进行主动降噪;基于混音信号驱动扬声器发声。本申请实施例的方案能够提高耳机的人声透传效果,同时减小耳机人声透传系统的功耗。同时减小耳机人声透传系统的功耗。同时减小耳机人声透传系统的功耗。

【技术实现步骤摘要】
人声透传方法、装置、耳机、存储介质及程序产品


[0001]本申请实施例涉及音频处理
,特别涉及一种人声透传方法、装置、耳机、存储介质及程序产品。

技术介绍

[0002]随着生活水平的提高,耳机已成为人们必不可少的生活用品。在机场、地铁、餐厅等嘈杂环境中,耳机的降噪功能能够最大限度消除外界噪音的干扰。但在用户需要接受外界语音以及外界环境噪音等场景下,耳机还需要具备透传功能,将外界的声音信号透传给用户,使用户无需摘下耳机即可听到外界的声音。
[0003]相关技术中,耳机的透传功能是将用户需要听到的目标声源信号以及其他声源信号均透传给用户,因此用户听到的声音中包含了目标声源以及其他声源,使得透传效果降低。

技术实现思路

[0004]本申请实施例提供了一种人声透传方法、装置、耳机、存储介质及程序产品,所述技术方案如下:
[0005]一方面,本申请实施例提供了一种人声透传方法,所述方法用于耳机,所述方法包括:
[0006]对采集到的外界音频信号进行人声识别;
[0007]在识别出所述外界音频信号中包含本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种人声透传方法,其特征在于,所述方法用于耳机,所述方法包括:对采集到的外界音频信号进行人声识别;在识别出所述外界音频信号中包含人声信号的情况下,从所述外界音频信号中分离所述人声信号;对分离得到所述人声信号和降噪信号进行混音处理,得到混音信号,所述降噪信号用于进行主动降噪;基于所述混音信号驱动扬声器发声。2.根据权利要求1所述的方法,其特征在于,所述对采集到的外界音频信号进行人声识别,包括:对采集到的所述外界音频信号进行特征提取,得到音频特征;通过VAD分类器对所述音频特征进行分类,得到分类结果,所述分类结果用于表征所述外界音频信号所包含信号的信号类型;所述在识别出所述外界音频信号中包含人声信号的情况下,从所述外界音频信号中分离所述人声信号,包括:在所述分类结果指示所述外界音频信号中包含所述人声信号的情况下,通过人声分离网络从所述外界音频信号中分离所述人声信号;其中,通过所述VAD分类器进行分类的功耗低于通过所述人声分离网络进行人声分离的功耗。3.根据权利要求2所述的方法,其特征在于,所述信号类型包括说话人声信号、环境噪声信号和音乐人声信号中的至少一种;所述在所述分类结果指示所述外界音频信号中包含所述人声信号的情况下,通过人声分离网络从所述外界音频信号中分离所述人声信号,包括:在所述分类结果指示所述外界音频信号中包含所述说话人声信号的情况下,通过所述人声分离网络从所述外界音频信号中分离所述人声信号。4.根据权利要求3所述的方法,其特征在于,所述VAD分类器基于包含样本信号类型标签的样本音频信号训练得到,所述样本音频信号由样本说话人声信号、样本环境噪声信号以及样本音乐人声信号中的至少两种信号混合得到。5.根据权利要求2所述的方法,其特征在于,所述通过人声分离网络从所述外界音频信号中分离所述人声信号,包括:对所述外界音频信号进行时频变换,得到所述外界音频信号的幅度谱和相位谱;通过所述人声分离网络对所述幅度谱进行人声概率预测,得到人声概率矩阵;基于所述人声概率矩阵和所述幅度谱生成所述人声信号的人声幅度谱;基于所述人声幅度谱和所述相位谱进行逆向时频变换,得到所述人声信号。6.根据权利要求5所述的方法,其特征在于,所述人声分离网络采用U

net;所述通过所述人声分离网络对所述幅度谱进行人声概率预测...

【专利技术属性】
技术研发人员:李芳庆黄景昌关智博李培硕
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1