一种基于声纹特征的电话场景音频获取与抗干扰处理方法技术

技术编号：31093706 阅读：27 留言：0更新日期：2021-12-01 13:00

本申请公开了一种基于声纹特征的电话场景音频获取与抗干扰处理方法。本方法包括：获取音频片段；获取音频片段的至少两个信号特征，至少两个信号特征包括以下任意两项或全部三项：混响时间特征、声纹特征、语音清晰度特征；基于至少两个信号特征，确定音频片段是否为干扰音频片段；若音频片段为干扰音频片段，则对音频片段进行抗干扰处理。本申请从音频片段的多个不同维度的信号特征来判断该音频片段是否为干扰音频片段，因此能更准确地判断音频片段是否为干扰音频片段，为后续抗干扰处理过程提供准确的数据支持。后续去干扰处理时可以尽可能地去除音频片段中的干扰，提高去除音频信号中的干扰的效果，尽可能降低干扰人声对指挥命令造成的影响。指挥命令造成的影响。指挥命令造成的影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于声纹特征的电话场景音频获取与抗干扰处理方法

[0001]本申请涉及音频信号处理
，更具体地，涉及一种基于声纹特征的电话场景音频获取与抗干扰处理方法。

技术介绍

[0002]调度中心中的调度员会综合各种数据以及当前实时反馈的信息，统一指挥调度部署。调度员下达指挥命令的准确性在调度过程中十分重要。然而，由于办公环境的限制，调度员通过麦克风下达的指挥命令不可避免会采集到其他人员的干扰人声。
[0003]相关技术中，通过具有指向性功能的麦克风解决指挥命令中存在干扰人声问题。具体地，具有指向性功能的麦克风在采集指挥命令时，将麦克风正前方向采集的声音信号确认为调度员发出的声音，正前方向之外的方向的声音信号确认为干扰声音信号，并对正前方向之外的多个方向的声音信号进行衰减，以降低干扰人声。
[0004]然而，具有指向性功能麦克风仅能够对指定方向的干扰人声进行抑制，且抑制程度最多 10dB，因此去除指挥命令中的干扰人声的效果不佳。

技术实现思路

[0005]本申请实施例提供一种基于声纹特征的电话场...

【技术保护点】

【技术特征摘要】
1.一种基于声纹特征的电话场景音频获取与抗干扰处理方法，其特征在于，所述方法包括：获取音频片段；获取所述音频片段的至少两个信号特征，所述至少两个信号特征包括以下任意两项或全部三项：混响时间特征、声纹特征、语音清晰度特征；基于所述至少两个信号特征，确定所述音频片段是否为干扰音频片段；若所述音频片段为所述干扰音频片段，则对所述音频片段进行抗干扰处理。2.根据权利要求1所述的方法，其特征在于，所述基于所述至少两个信号特征，确定所述音频片段是否为干扰音频片段，包括：基于所述至少两个信号特征，获取综合评价参数；基于所述综合评价参数，确定所述音频片段是否为干扰音频片段。3.根据权利要求2所述的方法，其特征在于，所述至少两个信号特征包括所述混响时间特征、所述声纹特征、所述语音清晰度特征；所述基于所述至少两个信号特征，获取综合评价参数，包括：对所述混响时间特征进行第一标准化处理，得到标准混响时间特征；获取所述声纹特征和预设声纹特征之间的声纹相似度，对所述声纹相似度进行第二标准化处理，得到标准声纹相似度；对所述语音清晰度特征进行第三标准化处理，得到标准语音清晰度特征；基于所述标准混响时间特征、所述标准声纹相似度和所述标准语音清晰度特征，获取所述综合评价参数。4.根据权利要求3所述的方法，其特征在于，所述对所述混响时间特征进行第一标准化处理，得到标准混响时间特征，包括：若所述混响时间特征小于第一混响时间特征值，则确定所述标准混响时间特征为第一混响时间预设值；若所述混响时间特征大于或等于第二混响时间特征值，则确定所述标准混响时间特征为第二混响时间预设值，所述第一所述混响时间特征值小于所述第二所述混响时间特征值，所述第一混响时间预设值大于所述第二混响时间预设值；若所述混响时间特征大于或等于所述第一混响时间特征值且小于所述第二混响时间特征值，则将所述混响时间特征映射到第一区间，得到所述标准混响时间特征，所述标准混响时间特征与所述混响时间特征之间呈负相关关系。5.根据权利要求3所述的方法，其特征在于，所述对所述声纹相似度进行第二标准化处理，得到标准声纹相似度，包括：若所述声纹相似度小于第一声纹相似度，则确定所述标准声纹相似度为第一声纹相似度预设值；若所述声纹相似度大于或等于第二声纹相似度，则确定所述标准声纹相似度为第二声纹相似度预设值，所述第一声纹相似度小于所述第二声纹相似度，所述第一声纹相似度预设值小于所述第二声纹相似度预设值；若所述声纹相似度大于或等于所述第一声纹相似度且小于所述第二声纹相似度，则将所述声纹相似度映射到第二区间，得到所述标准声纹相似度，所述标准声纹相似度与所述
声纹相似度之间呈正相关关系。6.根据权利要求3所述的方法，其特征在于，所述对所述语音清晰度特征进行第三标准化处理，得到标准语音清晰度特征，包括：若所述语音清晰度特征小于第一语音清晰度特征值，则确定所述标准语音清晰度特征为第一语音清晰度预设值；若所述语音清晰度特征大于或等于第二语音清晰度特征值，则确定所述标准语音清晰度特征为第二语音清...

【专利技术属性】
技术研发人员：郑颖龙，赖蔚蔚，吴广财，郑杰生，周昉昉，林嘉鑫，陈颖璇，叶杭，冯志鹏，吴穹，
申请(专利权)人：广东电力信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人