一种人声消除方法、装置、设备及介质制造方法及图纸

技术编号：26652010 阅读：29 留言：0更新日期：2020-12-09 00:54

本发明专利技术提供了一种人声消除方法、装置、设备及介质，由于本发明专利技术实施例中对初始时刻的第一音频数据进行自适应滤波操作，确定滤波器的第一振幅，并将第一音频数据中的左声道音频子数据和右声道音频子数据进行互相关操作，确定相似度最高的音频信号，将右声道音频子数据和左声道音频子数据中相似度最高的音频信号对齐得到第二音频数据，并对相似度最高的音频信号所在时刻的第二音频数据进行自适应滤波操作，确定滤波器的第二振幅。通过第一振幅和第二振幅分别与预设振幅阈值的差值，对对应的音频数据进行自适应滤波操作得到背景声音频，即差值不同，则进行自适应滤波操作的音频数据不同，实现了通过人声消除得到准确的背景声音频。

全部详细技术资料下载

【技术实现步骤摘要】
一种人声消除方法、装置、设备及介质
本专利技术涉及音频处理
，尤其涉及一种人声消除方法、装置、设备及介质。
技术介绍
K歌是时下热门的娱乐项目之一，用户可以通过K歌软件，进行K歌，但是K歌软件中的有些歌曲要收费，并且歌曲数量比较少。当在某智能发声设备中听到自己喜欢的歌曲，想要进行K歌时，需要该智能发声设备将歌曲中的人声进行消除。图1为现有技术中的人声消除的流程示意图，图2为现有技术中的左、右声道音频子数据的示意图，现结合图1和图2说明现有技术中的人声消除过程。如图1所示，接收到音频数据后，获取其左声道音频子数据和右声道音频子数据，对该左、右声道音频子数据进行人声分离，得到背景声音频。在图2中，最粗的曲线为左、右声道音频子数据中的人声信号，人声信号在左、右声道音频子数据中的相位和幅度是相同。另外两条曲线代表左、右声道音频子数据中的背景声音频，它们之间存在偏移时间。现有的人声消除技术主要包括：一、对左、右声道音频子数据进行加权相减，获取背景声音频；二、利用左、右声道音频子数据的相关性，采用自适应滤波...

【技术保护点】
1.一种人声消除方法，其特征在于，所述方法包括：/n将第一音频数据中的左声道音频子数据和右声道音频子数据进行互相关操作，确定相似度最高的音频信号在左、右声道音频子数据中对应的第一偏移时间；/n对初始时刻的所述第一音频数据进行自适应滤波操作，确定滤波器的第一振幅，根据所述第一偏移时间，将所述右声道音频子数据和所述左声道音频子数据所述相似度最高的音频信号对齐得到第二音频数据，并对相似度最高的音频信号所在时刻的所述第二音频数据进行自适应滤波操作，确定滤波器的第二振幅；/n根据所述第一振幅和第二振幅分别与预设振幅阈值的差值，对对应的音频数据进行自适应滤波操作得到背景声音频。/n

【技术特征摘要】
1.一种人声消除方法，其特征在于，所述方法包括：
将第一音频数据中的左声道音频子数据和右声道音频子数据进行互相关操作，确定相似度最高的音频信号在左、右声道音频子数据中对应的第一偏移时间；
对初始时刻的所述第一音频数据进行自适应滤波操作，确定滤波器的第一振幅，根据所述第一偏移时间，将所述右声道音频子数据和所述左声道音频子数据所述相似度最高的音频信号对齐得到第二音频数据，并对相似度最高的音频信号所在时刻的所述第二音频数据进行自适应滤波操作，确定滤波器的第二振幅；
根据所述第一振幅和第二振幅分别与预设振幅阈值的差值，对对应的音频数据进行自适应滤波操作得到背景声音频。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一振幅和第二振幅分别与预设振幅阈值的差值，对对应的音频数据进行自适应滤波操作得到背景声音频包括：
若所述第一振幅和第二振幅分别与预设振幅阈值的差值均在预设差值范围内，且所述第一偏移时间小于预设偏移时间，则确定所述左声道音频子数据和所述右声道音频子数据的差值信号，对所述差值信号进行自适应滤波操作，得到第一背景声音频。

3.根据权利要求1所述的方法，其特征在于，所述根据所述第一振幅和第二振幅分别与预设振幅阈值的差值，对对应的音频数据进行自适应滤波操作得到背景声音频包括：
若所述第一振幅与预设振幅阈值的第一差值不在所述预设差值范围内，且所述第二音频信号与预设振幅阈值的第二差值在所述预设差值范围内，则对所述第二音频数据进行自适应滤波，得到第三音频数据，并对所述第三音频数据进行自适应滤波，得到第二背景声音频。

4.根据权利要求1-3任一所述的方法，其特征在于，所述根据所述第一振幅和第二振幅分别与预设振幅阈值的差值，对对应的音频数据进行自适应滤波操作得到背景声音频包括：
若所述第一振幅和第二振幅分别与预设振幅阈值的差值均不在所述预设差值范围内，或，所述第一偏移时间大于预设偏移时间，或，第一振幅与预设振幅阈值的第一差值在预设差值范围内，且第二振幅与预设振幅阈值的第二差值不在预设差值范围内，则对所述第一音频信号进行自适应滤波操作，得到第三背景声音频。

5.根据权利要求1所述的方法，其特征在于，所述对初始时刻的所述第一音频数据进行自适应滤波操作，确定滤波器的...

【专利技术属性】
技术研发人员：姜元恩，邢文峰，
申请(专利权)人：海信视像科技股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人