声音信号处理方法、装置及系统、终端及存储介质制造方法及图纸

技术编号:19704613 阅读:32 留言:0更新日期:2018-12-08 14:55
本申请公开了一种声音信号处理方法、装置及系统、终端及存储介质,属于声音信号处理领域。所述方法包括:获取两组声音输入信号;对所述两组声音输入信号进行相干估计得到每组声音输入信号的相干信号;将每组声音输入信号与对应的相干信号之差确定为每组声音输入信号的离散信号;基于头相关传递函数HRTF对所述每组声音输入信号的相干信号进行声像扩展处理,以得到每组声音输入信号的对应的声像扩展后的相干信号;对于每组声音输入信号,将声像扩展后的相干信号与所述离散信号之和确定为对应的声音输出信号。本申请扩展声音信号时不会将不必要的信息引入输出的信号中,不会导致输出的信号失真。本申请用于声音信号处理。

【技术实现步骤摘要】
声音信号处理方法、装置及系统、终端及存储介质
本申请涉及声音信号处理领域,特别涉及一种声音信号处理方法、装置及系统、终端及存储介质。
技术介绍
为了获得更好的听觉体验,越来越多的人选择使用耳机播放立体声信号。但是,若直接在耳机上播放输入的立体声信号,播放出的声音会出现声像过窄的现象,使听音者听到的声音的立体感较弱,导致听音者的听觉体验不佳,其中,声像是指在听音者听感中展现的各声部的空间位置所形成的声画面。因此,如何对输入的立体声信号进行声像扩展并输出是重要的技术热点。相关技术中,使用双耳房间冲击响应(BRIR,BinauralRoomImpulseResponse)对输入的立体声信号进行处理,以得到扩展声像后的输出信号,其中,BRIR描述了声音在房间中从声源到声音接收位置处的传输过程。具体地,该信号处理过程为:分别将输入的立体声信号包括的多组信号中的每组信号与左耳BRIR序列做卷积运算,然后将得到的多个卷积运算结果之和作为左耳输出信号,同时,分别将输入的立体声信号包括的多组信号中的每组信号与右耳BRIR序列做卷积运算,然后将得到的多个卷积运算结果之和作为右耳输出信号。但是,由于BRIR描述的是房间中的声音传输过程,其中包含了房间的虚拟空间信息,因此,使用BRIR对输入的立体声信号进行处理时,会将该房间的虚拟空间信息引入到输出的信号中,使得输出的信号中包含不必要的信息,导致输出的信号失真。
技术实现思路
为了解决相关技术中使用BRIR对输入的立体声信号进行处理时,会将该房间的虚拟空间信息引入到输出的信号中,使得输出的信号中包含不必要的信息,导致输出的信号失真的问题,本本申请示例性实施例提供了一种声音信号处理方法、装置及系统、终端及存储介质。所述技术方案如下:第一方面,本申请示例性实施例提供了一种声音信号处理方法,所述方法包括:获取两组声音输入信号;对所述两组声音输入信号进行相干估计得到每组声音输入信号的相干信号;将每组声音输入信号与对应的相干信号之差确定为每组声音输入信号的离散信号;基于头相关传递函数HRTF对所述每组声音输入信号的相干信号进行声像扩展处理,以得到每组声音输入信号的对应的声像扩展后的相干信号;对于每组声音输入信号,将声像扩展后的相干信号与所述离散信号之和确定为对应的声音输出信号。本申请示例性实施例提供的声音信号处理方法,通过对两组声音输入信号进行相干估计得到每组声音输入信号的相干信号,将每组声音输入信号与对应的相干信号之差确定为每组声音输入信号的离散信号,基于头相关传递函数对每组声音输入信号的相干信号进行声像扩展处理,以得到每组声音输入信号的对应的声像扩展后的相干信号,对于每组声音输入信号,将声像扩展后的相干信号与离散信号之和确定为对应的声音输出信号,由于头相关传递函数是在消音室中测量得到的,其中不包含房间的虚拟空间信息,基于头相关传递函数扩展得到的信号中不包含房间的虚拟空间信息,不会将不必要的信息引入输出的信号中,不会导致输出的信号失真,有效地提高了听音者的听觉体验。可选地,所述基于头相关传递函数HRTF对所述每组声音输入信号的相干信号进行声像扩展处理,以得到每组声音输入信号的对应的声像扩展后的相干信号,包括:确定所述每组声音输入信号对应的相干信号的功率谱密度;根据每个相干信号对应的功率谱密度计算所述两组声音输入信号对应的相干信号功率谱增益;根据所述两组声音输入信号对应的相干信号功率谱增益确定所述两组声音输入信号对应的初始定位角;根据所述初始定位角和所述头相关传递函数,按照信号处理公式对所述两组声音输入信号进行处理,以得到每组声音输入信号的对应的声像扩展后的相干信号,所述信号处理公式为:其中,所述两组声音输入信号包括第一声音输入信号和第二声音输入信号,所述Xi6为所述两组声音输入信号中任一组声音输入信号对应的声像扩展后的相干信号,所述Xi2为所述两组声音输入信号中任一组声音输入信号对应的相干信号,所述α为所述初始定位角,所述c为预设的声像扩展比例,所述cα为将所述初始定位角待扩展到的目标角度,所述为在所述目标角度所对应的头相关传递函数的相位差,所述Ai(cα)为所述两组声音输入信号中任一组声音输入信号在所述目标角度所对应的头相关传递函数的幅度,所述PL2为所述第一声音输入信号对应的相干信号的功率谱密度,所述PR2为所述第二声音输入信号对应的相干信号的功率谱密度。需要说明的是,由于该头相关传递函数是在消音室中测量得到的,其不包含房间的虚拟空间信息,因此,使用该头相关传递函数对声音输入信号进行扩展时,不会将房间的虚拟空间信息带入到扩展后的信号中,进而不会导致输出的信号失真。并且,由于其不会将房间的虚拟空间信息带入到处理后的声音信号中,其还能够保证声音信号的声波不会因为相互干涉造成信号的振幅失真,进而保证了声音信号的音质。可选地,所述对所述两组声音输入信号进行相干估计得到每组声音输入信号的相干信号,包括:确定所述两组声音输入信号对应的离散成分功率谱;根据所述离散成分功率谱确定每组声音输入信号对应的相干信号增益;根据所述每组声音输入信号对应的相干信号增益确定每组声音输入信号的相干信号。需要说明的是,通过计算两组声音输入信号的离散成分功率谱,然后根据离散成分的功率谱确定每组声音输入信号对应的相干信号增益,再根据其确定每组声音输入信号的相干信号,是对两组声音输入信号进行相干估计得到每组声音输入信号的相干信号的具体实现方式。可选地,所述两组声音输入信号包括第一声音输入信号和第二声音输入信号,所述确定所述两组声音输入信号对应的离散成分功率谱,包括:确定所述第一声音输入信号和所述第二声音输入信号的相关系数;确定每组声音输入信号对应的功率谱密度;根据所述相关系数和所述每组声音输入信号对应的功率谱密度,按照离散成分功率谱计算公式确定所述离散成分功率谱,所述离散成分功率谱计算公式为:Pdiff=min(PL1,PR1)max(ρ,threshold);其中,所述Pdiff为所述离散成分功率谱,所述PL1为所述第一声音输入信号对应的功率谱密度,所述PR1为所述第二声音输入信号对应的功率谱密度,所述ρ为所述相关系数,所述threshold为预设的相关系数的阈值,所述min为取最小值函数,所述max为取最大值函数。需要说明的是,在根据声音输入信号确定每组声音输入信号的相干信号时,为了保证听音者的听觉感受,需要保证确定的相干信号中包括有一定成分的离散信号,因此,在确定离散成分功率谱时,需要为信号的相关系数设置阈值。可选地,在所述基于头相关传递函数HRTF对所述每组声音输入信号的相干信号进行声像扩展处理之前,所述方法还包括:将每组声音输入信号的离散信号与预设比例值的乘积作为每组声音输入信号的待插入离散信号;将所述每组声音输入信号的相干信号与对应的待插入离散信号之和,确定为更新后的每组声音输入信号的相干信号。需要说的是,为了保证听音者的听觉感受,可以使确定的相干信号中包括有一定成分的离散信号,因此,在为相关系数设置阈值的基础上,还可以通过向该相干信号中插入一定成分的离散信号,以实现对相干信号的进一步调整。可选地,在所述确定所述第一声音输入信号和所述第二声音输入信号的相关系数之前,所述方法还包括:对所述第一声音输本文档来自技高网...

【技术保护点】
1.一种声音信号处理方法,其特征在于,所述方法包括:获取两组声音输入信号;对所述两组声音输入信号进行相干估计得到每组声音输入信号的相干信号;将每组声音输入信号与对应的相干信号之差确定为每组声音输入信号的离散信号;基于头相关传递函数HRTF对所述每组声音输入信号的相干信号进行声像扩展处理,以得到每组声音输入信号的对应的声像扩展后的相干信号;对于每组声音输入信号,将声像扩展后的相干信号与所述离散信号之和确定为对应的声音输出信号。

【技术特征摘要】
1.一种声音信号处理方法,其特征在于,所述方法包括:获取两组声音输入信号;对所述两组声音输入信号进行相干估计得到每组声音输入信号的相干信号;将每组声音输入信号与对应的相干信号之差确定为每组声音输入信号的离散信号;基于头相关传递函数HRTF对所述每组声音输入信号的相干信号进行声像扩展处理,以得到每组声音输入信号的对应的声像扩展后的相干信号;对于每组声音输入信号,将声像扩展后的相干信号与所述离散信号之和确定为对应的声音输出信号。2.根据权利要求1所述的方法,其特征在于,所述基于头相关传递函数HRTF对所述每组声音输入信号的相干信号进行声像扩展处理,以得到每组声音输入信号的对应的声像扩展后的相干信号,包括:确定所述每组声音输入信号对应的相干信号的功率谱密度;根据每个相干信号对应的功率谱密度计算所述两组声音输入信号对应的相干信号功率谱增益;根据所述两组声音输入信号对应的相干信号功率谱增益确定所述两组声音输入信号对应的初始定位角;根据所述初始定位角和所述头相关传递函数,按照信号处理公式对所述两组声音输入信号进行处理,以得到每组声音输入信号的对应的声像扩展后的相干信号,所述信号处理公式为:其中,所述两组声音输入信号包括第一声音输入信号和第二声音输入信号,所述Xi6为所述两组声音输入信号中任一组声音输入信号对应的声像扩展后的相干信号,所述Xi2为所述两组声音输入信号中任一组声音输入信号对应的相干信号,所述ɑ为所述初始定位角,所述c为预设的声像扩展比例,所述cα为将所述初始定位角待扩展到的目标角度,所述为在所述目标角度所对应的头相关传递函数的相位差,所述Ai(cα)为所述两组声音输入信号中任一组声音输入信号在所述目标角度所对应的头相关传递函数的幅度,所述PL2为所述第一声音输入信号对应的相干信号的功率谱密度,所述PR2为所述第二声音输入信号对应的相干信号的功率谱密度。3.根据权利要求1或2所述的方法,其特征在于,所述对所述两组声音输入信号进行相干估计得到每组声音输入信号的相干信号,包括:确定所述两组声音输入信号对应的离散成分功率谱;根据所述离散成分功率谱确定每组声音输入信号对应的相干信号增益;根据所述每组声音输入信号对应的相干信号增益确定每组声音输入信号的相干信号。4.根据权利要求3所述的方法,其特征在于,所述两组声音输入信号包括第一声音输入信号和第二声音输入信号,所述确定所述两组声音输入信号对应的离散成分功率谱,包括:确定所述第一声音输入信号和所述第二声音输入信号的相关系数;确定每组声音输入信号对应的功率谱密度;根据所述相关系数和所述每组声音输入信号对应的功率谱密度,按照离散成分功率谱计算公式确定所述离散成分功率谱,所述离散成分功率谱计算公式为:Pdiff=min(PL1,PR1)max(ρ,threshold);其中,所述Pdiff为所述离散成分功率谱,所述PL1为所述第一声音输入信号对应的功率谱密度,所述PR1为所述第二声音输入信号对应的功率谱密度,所述ρ为所述相关系数,所述threshold为预设的相关系数的阈值,所述min为取最小值函数,所述max为取最大值函数。5.根据权利要求1所述的方法,其特征在于,在所述基于头相关传递函数HRTF对所述每组声音输入信号的相干信号进行声像扩展处理之前,所述方法还包括:将每组声音输入信号的离散信号与预设比例值的乘积作为每组声音输入信号的待插入离散信号;将所述每组声音输入信号的相干信号与对应的待插入离散信号之和,确定为更新后的每组声音输入信号的相干信号。6.根据权利要求4所述的方法,其特征在于,在所述确定所述第一声音输入信号和所述第二声音输入信号的相关系数之前,所述方法还包括:对所述第一声音输入信号和所述第二声音输入信号进行傅里叶变换,以得到频域上的第一声音输入信号和第二声音输入信号。7.根据权利要求1所述的方法,其特征在于,所述获取两组声音输入信号,包括:获取左通道声音输入信号和右通道声音输入信号,作为所述两组声音输入信号;或者,获取至少三组初始声音输入信号;将所述至少三组初始声音输入信号进行下混处理,得到所述两组声音输入信号。8.根据权利要求7所述的方法,其特征在于,所述至少三组初始声音输入信号为五通道信号。9.一种声音信号处理装置,其特征在于,所述装置包括:获取模块,用于获取两组声音输入信号;分解模块,用于对所述两组声音输入信号进行相干估计得到每组声音输入信号的相干信号;第一确定模块,用于将每组声音输入信号与对应的相干信号之差确定为每组声音输入信号的离散信号;处理模块,用于基于头相关传递函数HRTF对所述每组...

【专利技术属性】
技术研发人员:陈日林李贤胜赵翔宇
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1