一种自监督对比学习语音情感识别方法、装置及存储装置制造方法及图纸

技术编号:46326686 阅读:7 留言:0更新日期:2025-09-09 19:07
本发明专利技术涉及基于自监督对比学习语音情感识别方法和装置,其中方法包括:采集真实沟通环境中对话录音音频数据,并对所述音频数据进行数据清洗和规范化处理,得到预处理数据;构建基于自监督对比学习的CNN‑GRU轻量级在线语音情感识别模型;将预处理数据输入到1D‑CNN编码器中,使用对比预测编码(CPC)对CNN编码器进行自监督预训练;冻结CNN编码器中的参数,并将其连接到新的GRU单元;使用GRU的最终输出产生最终预测;最后将目标语音情感识别模型部署应用得到在线语言情感分类模型。本发明专利技术提高了语音分类准确率与检测效率,且在语言识别领域有很强的泛化能力。

【技术实现步骤摘要】

本专利技术属于人工智能语音情感识别和应用领域。特别涉及语音情感识别领域的状态感知方法、装置及存储介质。


技术介绍

1、语音情感识别是人机交互、社交机器人、智能客服和多领域自然语言处理应用等多个领域中至关重要的任务,它可以使机器更好地理解和响应人类的情感状态,提高服务质量,改善用户体验,以及加强情感理解和沟通。它对于实现更智能、人性化的系统和应用程序具有重要意义。语音情感识别广泛应用于医疗辅助治疗、广告和市场研究、呼叫中心和客户服务等。客户的不满或愤怒情绪可以触发客服代表提供更加细致的服务,改善客户体验。

2、自监督对比学习作为一种前沿的技术方法,在语音情感识别领域具有重要的技术基础。传统的监督学习方法通常需要大量标记好的数据训练模型,但这种方式存在数据获取困难、标注成本高昂的问题。而自监督对比学习则通过利用数据自身的信息特性,无需显式标签,通过数据样本间的对比学习模式,使得模型可以自行学习特征表示,从而实现情感识别的目的。


技术实现思路

1、本专利技术提供一种基于自监督对比学习语音情感识别方法、装本文档来自技高网...

【技术保护点】

1.基于自监督对比学习语音情感识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的自监督对比学习语音情感识别方法,其特征在于,所述采集真实环境中通话录音的音频数据,并对所述音频数据进行数据清洗和规范化处理,得到预处理数据包括:

3.根据权利要求1所述的自监督对比学习语音情感识别方法,其特征在于,所述构建基于自监督对比学习的CNN-GRU轻量级在线语音情感识别模型,包括:

4.根据权利要求1所述的自监督对比学习语音情感识别方法,其特征在于,所述将预处理数据输入到1D-CNN编码器中,使用对比预测编码(CPC)对CNN编码器进行自监督预训练,包括...

【技术特征摘要】

1.基于自监督对比学习语音情感识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的自监督对比学习语音情感识别方法,其特征在于,所述采集真实环境中通话录音的音频数据,并对所述音频数据进行数据清洗和规范化处理,得到预处理数据包括:

3.根据权利要求1所述的自监督对比学习语音情感识别方法,其特征在于,所述构建基于自监督对比学习的cnn-gru轻量级在线语音情感识别模型,包括:

4.根据权利要求1所述的自监督对比学习语音情感识别方法,其特征在于,所述将预处理数据输入到1d-cnn编码器中,使用对比预测编码...

【专利技术属性】
技术研发人员:王冠请求不公布姓名请求不公布姓名
申请(专利权)人:深圳贝尔信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1