一种基于复杂场景的自适应声纹识别方法技术

技术编号:42874085 阅读:22 留言:0更新日期:2024-09-30 15:00
本发明专利技术公开的一种基于复杂场景的自适应声纹识别方法,属于语音领域的自适应声纹识别领域。本发明专利技术实现方法为:构建域自适应声纹模型,基于CN‑Celeb数据采用增量学习策略训练自适应声纹模型,通过模型蒸馏实现对已有源域知识的保留和对目标域知识的快速吸收,避免在域迁移过程中的灾难性遗忘;自适应声纹模型通过联合源域和目标域的半监督训练方法,优化自适应声纹模型在两个域上的表现,使自适应声纹模型能够适应新的数据分布,在复杂场景中基于训练好的域自适应声纹模型实现自适应声纹识别,有效克服灾难性遗忘现象。本发明专利技术能够提升对复杂场景中自适应声纹识别的准确率和鲁棒性。本发明专利技术尤其是能够提升在戏剧、歌声等多变环境下识别的准确率和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及一种基于复杂场景的自适应声纹识别方法,属于语音领域的自适应声纹识别领域。


技术介绍

1、在声纹识别
,该技术已在安全验证、智能客服、个性化推荐系统以及法律取证等多个行业展现出广泛的应用潜力。随着智能设备的普及,声纹识别因其便捷性、非侵入性以及高准确性而日益受到重视。然而,在多变的使用环境中,如不同的录音条件、说话人的口音和情绪变化等,声纹识别系统的性能可能面临挑战。特别是在复杂场景中,如嘈杂的环境下,或歌声、戏剧等场景,自适应声纹识别技术变得至关重要,它能够使系统自动调整以适应不同的场景条件,从而保持高准确率。

2、与本专利技术最接近的专利为:一种融合分布对齐和对抗学习的无监督跨域声纹识别方法,但是其仅针对于目标域性能提升,本方法引入增量学习,让声纹识别的性能不仅在目标域中有一定的提升,在源域中也可以利用模型蒸馏防止遗忘,得到一定提升。因此本专利技术相比于最接近的专利技术专利更具有在复杂场景下的自适应性。


技术实现思路

1、为了解决现有技术存在复杂场景的真实情况下声纹识别不精准本文档来自技高网...

【技术保护点】

1.一种基于复杂场景的自适应声纹识别方法,其特征在于:包括如下步骤,

2.如权利要求1所述的一种基于复杂场景的自适应声纹识别方法,其特征在于:步骤三实现方法为,

3.如权利要求2所述的一种基于复杂场景的自适应声纹识别方法,其特征在于:步骤五实现方法为,步骤5.1:利用自适应声纹模型对语音输入进行注册,得到注册说话人特征;

4.如权利要求3所述的一种基于复杂场景的自适应声纹识别方法,其特征在于:在安全监控领域,训练好的自适应声纹模型用于实时监测和识别关键区域的声音信号,以区分正常活动和异常事件;银行或政府设施中,自适应声纹模型通过声纹识别来快速确认是否有...

【技术特征摘要】

1.一种基于复杂场景的自适应声纹识别方法,其特征在于:包括如下步骤,

2.如权利要求1所述的一种基于复杂场景的自适应声纹识别方法,其特征在于:步骤三实现方法为,

3.如权利要求2所述的一种基于复杂场景的自适应声纹识别方法,其特征在于:步骤五实现方法为,步骤5.1:利用自适应声纹模型对语音输入进行注册,得到注册说话人特征;

4.如权利要求3所述的一种基于复杂场景的自适应声纹识别方法,其特征在于:在安全监控领...

【专利技术属性】
技术研发人员:谢湘苏欣美
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1