【技术实现步骤摘要】
一种目标声源的提取方法及装置
本专利技术涉及语音提取
,尤其涉及一种目标声源的提取方法及装置。
技术介绍
嘈杂环境中提取感兴趣的目标声源被称为“鸡尾酒会问题”,在实际环境中,声音的传播经过反射、多径传播、叠加,到达传声器的时候与源声源有很大差异了,想从传声器提取感兴趣声音变得格外困难。现有技术中利用声音采集设备采集声源数据,然后使用SRP和粒子滤波对声源数据进行定位和跟踪,盲语音分离根据声源方位信息对麦克风信号进行分离并进行后置滤波,得到独立声源。上述的方法中,在噪声和混响场景下或者间隔短的不同声源,定位结果有较大误差,无法做到准确定位。
技术实现思路
有鉴于此,本专利技术提供了一种目标声源的提取方法及装置,用以解决在噪声和混响场景下或者间隔短的不同声源,定位结果有较大误差,无法做到准确定位的问题。具体方案如下:一种目标声源的提取方法,包括:获取第一数量的声音采集设备采集的音频数据;确定所述音频数据中声源的第二数量;将所述第一数量与所述第二数量进行对比 ...
【技术保护点】
1.一种目标声源的提取方法,其特征在于,包括:/n获取第一数量的声音采集设备采集的音频数据;/n确定所述音频数据中声源的第二数量;/n将所述第一数量与所述第二数量进行对比,依据对比结果选取对应的目标盲源分离方法对所述音频数据进行盲源分离,得到各个声源;/n选取所述各个声源中存在预设激活词的声源作为目标声源。/n
【技术特征摘要】
1.一种目标声源的提取方法,其特征在于,包括:
获取第一数量的声音采集设备采集的音频数据;
确定所述音频数据中声源的第二数量;
将所述第一数量与所述第二数量进行对比,依据对比结果选取对应的目标盲源分离方法对所述音频数据进行盲源分离,得到各个声源;
选取所述各个声源中存在预设激活词的声源作为目标声源。
2.根据权利要求1所述的方法,其特征在于,确定所述音频数据中声源的第二数量,包括:
对所述音频数据进行傅里叶变换,得到频域音频数据;
计算所述音频数据的协方差矩阵,对所述协方差矩阵进行变换;
依据盖氏圆法确定所述音频中声源的第二数量。
3.根据权利要求1所述的方法,其特征在于,依据对比结果选取对应的目标盲源分离方法对所述音频数据进行盲源分离,得到各个声源,包括:
若所述第一数量等于所述第二数量,采用频域独立分量分析方法或独立向量分析方法对所述音频数据进行盲源分离,得到各个声源。
4.根据权利要求1所述的方法,其特征在于,依据对比结果选取对应的目标盲源分离方法对所述音频数据进行盲源分离,得到各个声源,包括:
若所述第一数量大于所述第二数量,采用主成分分析法将所述音频数据降将至第二数量维度,得到目标音频数据;
采用频域独立分量分析方法或独立向量分析方法对所述目标音频数据进行盲源分离,得到各个声源。
5.根据权利...
【专利技术属性】
技术研发人员:陈孝良,钱思冲,冯大航,常乐,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。