声音信号处理方法、装置、设备及介质制造方法及图纸

技术编号:38017642 阅读:15 留言:0更新日期:2023-06-30 10:44
本公开涉及一种声音信号处理方法、装置、设备及介质,涉及音频处理技术领域;其中,该方法包括:获取外接设备的声音采集模块采集的第一声音信号和外接设备已发送至显示设备的第二声音信号,其中,第一声音信号包括用户语音信号和显示设备播放的目标音频信号;通过延时估计方法,确定第二声音信号中的原始音频信号和目标音频信号之间的延迟时间;对目标音频信号进行滤波处理,确定残差信号;通过延迟时间、残差信号以及原始音频信号对第一声音信号进行处理,确定用户语音信号。本公开实施例通过对第一声音信号进行处理,能够得到较为准确的用户语音信号,从而对用户语音信号进行识别时,有利于提高识别结果的准确性,提升用户的使用体验。使用体验。使用体验。

【技术实现步骤摘要】
声音信号处理方法、装置、设备及介质


[0001]本公开涉及一种音频处理
,尤其涉及一种声音信号处理方法、装置、设备及介质。

技术介绍

[0002]外接设备(如电视盒子、智能音箱等)作为一种家庭娱乐设备已经得到广泛应用,近年来随着语音识别等相关的语音技术不断发展,能够通过语音控制外接设备。
[0003]当外接设备与显示设备相连时,外接设备将信号发送给显示设备,以供显示设备显示图像和/或播放声音。在这种情况下,外接设备的麦克风采集的声音信号中通常包括语音指令和显示设备播放节目的声音,当外接设备对声音信号进行识别时,会造成识别结果不准确的问题,从而影响用户的使用体验。

技术实现思路

[0004]为了解决上述技术或者至少部分地解决上述技术问题,本公开提供了一种声音信号处理方法、装置、设备及介质,能够对第一声音信号进行处理,能够从第一声音信号中滤除显示设备播放节目的声音,得到较为准确的用户语音信号,从而对用户语音信号进行识别时,有利于提高识别结果的准确性,提升用户的使用体验。
[0005]为了实现上述目的,本公开实施例提供的技术方案如下:
[0006]第一方面,本公开提供了一种声音信号处理方法,该方法包括:
[0007]获取外接设备的声音采集模块采集的第一声音信号和所述外接设备已发送至显示设备的第二声音信号,其中,所述第一声音信号包括用户语音信号和所述显示设备播放的目标音频信号,所述第二声音信号中包括:所述目标音频信号对应的原始音频信号;
[0008]通过延时估计方法,确定所述第二声音信号中的所述原始音频信号和所述目标音频信号之间的延迟时间;
[0009]对所述目标音频信号进行滤波处理,确定残差信号;
[0010]通过所述延迟时间、所述残差信号以及所述原始音频信号对所述第一声音信号进行处理,确定所述用户语音信号。
[0011]第二方面,本公开提供了一种声音信号处理装置,该装置包括:
[0012]信号获取模块,用于获取外接设备的声音采集模块采集的第一声音信号和所述外接设备已发送至显示设备的第二声音信号,其中,所述第一声音信号包括用户语音信号和所述显示设备播放的目标音频信号,所述第二声音信号中包括:所述目标音频信号对应的原始音频信号;
[0013]第一确定模块,用于通过延时估计方法,确定所述第二声音信号中的所述原始音频信号和所述目标音频信号之间的延迟时间;
[0014]第二确定模块,用于对所述目标音频信号进行滤波处理,确定残差信号;
[0015]第三确定模块,用于通过所述延迟时间、所述残差信号以及所述原始音频信号对
所述第一声音信号进行处理,确定所述用户语音信号。
[0016]第三方面,本公开还提供了一种电子设备,包括:
[0017]一个或多个处理器;
[0018]存储装置,用于存储一个或多个程序,
[0019]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本公开实施例中的任一种所述的声音信号处理方法。
[0020]第四方面,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开实施例中的任一种所述的声音信号处理方法。
[0021]本公开实施例提供的技术方案与现有技术相比具有如下优点:获取外接设备的声音采集模块采集的第一声音信号和外接设备已发送至显示设备的第二声音信号,其中,第一声音信号包括用户语音信号和显示设备播放的目标音频信号,第二声音信号中包括:目标音频信号对应的原始音频信号;通过延时估计方法,确定第二声音信号中的原始音频信号和目标音频信号之间的延迟时间;对目标音频信号进行滤波处理,确定残差信号;通过延迟时间、残差信号以及原始音频信号对第一声音信号进行处理,确定用户语音信号,上述技术方案中,通过对第一声音信号进行处理,能够从第一声音信号中滤除显示设备播放节目的声音,得到较为准确的用户语音信号,从而对用户语音信号进行识别时,有利于提高识别结果的准确性,提升用户的使用体验。
附图说明
[0022]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0023]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0024]图1A为相关技术中外接设备单独使用时的声音信号处理过程示意图;
[0025]图1B为相关技术中外接设备与显示设备相连时的结构示意图;
[0026]图1C为本公开实施例中一种声音信号处理过程的适用场景示意图;
[0027]图2为本公开实施例提供的一种声音信号处理方法的流程示意图;
[0028]图3为本公开实施例提供的一种声音信号处理过程的结构示意图;
[0029]图4为本公开实施例提供的另一种声音信号处理方法的流程示意图;
[0030]图5为本公开实施例提供的又一种声音信号处理方法的流程示意图;
[0031]图6A为本公开实施例提供的一种声音信号处理装置的结构示意图;
[0032]图6B为本公开实施例声音信号处理装置中第三确定模块的结构示意图;
[0033]图7为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0034]为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
[0035]在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
[0036]需要说明的是,本公开中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
[0037]需要说明的是,在本公开中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。...

【技术保护点】

【技术特征摘要】
1.一种声音信号处理方法,其特征在于,所述方法包括:获取外接设备的声音采集模块采集的第一声音信号和所述外接设备已发送至显示设备的第二声音信号,其中,所述第一声音信号包括用户语音信号和所述显示设备播放的目标音频信号,所述第二声音信号中包括:所述目标音频信号对应的原始音频信号;通过延时估计方法,确定所述第二声音信号中的所述原始音频信号和所述目标音频信号之间的延迟时间;对所述目标音频信号进行滤波处理,确定残差信号;通过所述延迟时间、所述残差信号以及所述原始音频信号对所述第一声音信号进行处理,确定所述用户语音信号。2.根据权利要求1所述的方法,其特征在于,所述通过所述延迟时间、所述残差信号以及所述原始音频信号对所述第一声音信号进行处理,确定所述用户语音信号,包括:基于所述延迟时间,对所述原始音频信号进行对齐,得到第三声音信号;将所述第一声音信号与所述第三声音信号相减,得到参考语音信号;根据所述参考语音信号和所述残差信号,确定所述用户语音信号。3.根据权利要求2所述的方法,其特征在于,所述根据所述参考语音信号和所述残差信号,确定所述用户语音信号,包括:对所述残差信号进行非线性处理,确定所述残差信号对应的功率谱;基于所述功率谱和降噪算法对所述参考语音信号进行降噪处理,得到所述用户语音信号。4.根据权利要求1所述的方法,其特征在于,所述对所述目标音频信号进行滤波处理,确定残差信号,包括:对所述目标音频信号进行滤波处理,确定所述目标音频信号中的回声信号;将所述目标音频信号与所述回声信号相减,得到所述残差信号。5.根据权利要求1所述的方法,其特征在于,所述通过延时估计方法,确定所述第二声音信号中的所述原始音频信号和所述目标音频信号之间的延迟时间,包括:对所述第二声音信号中的所述原始音频信号进行特征提取,得到第一声学特征;对所述目标音频信号进行特征提取,得到第二声学特征;将所述第一声学特征和所述第二声学特征输入至时延估计模型中,得到所述延迟时间。6.根据权利要求5所述的方法,其特征在于,所述时延估计模型...

【专利技术属性】
技术研发人员:王林巩家旭
申请(专利权)人:海信视像科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1