面向语音识别噪声场景下多模态情感分析方法及系统技术方案

技术编号:43564136 阅读:20 留言:0更新日期:2024-12-06 17:35
本发明专利技术涉及面向语音识别噪声场景下多模态情感分析方法及系统,属自然语言处理领域。本发明专利技术通过多层次聚类方法,在模态内充分利用样本情感得分信息弥补文本模态在语音识别后损失的情感语义信息,之后在模态间根据不同样本的情感得分信息辅助对比学习进行跨模态情感信息的精炼,最后得到蕴含丰富情感语义的融合模态表示。本发明专利技术在包含语音识别噪声的真实世界数据集上进行了广泛实验,结果证明了本发明专利技术在面对语音识别噪声干扰时表现出更好的鲁棒性和泛化能力。

【技术实现步骤摘要】


技术介绍

1、随着社交媒体的发展,人们可以使用多种信息(文字,图片,视频)共同表达情感。在现实生活中,由于用户行为的多样性等干扰因素的存在,经常会遇到部分模态可能缺失的情况,其中以缺少文本模态的无字幕视频最为常见。文本是情感分析中最重要的一个模态,因此为了确保情感预测的准确性,现今常常会借助语音识别技术生成对应的视频字幕。然而,由于语音识别本身的能力限制,可能会在识别过程中引入文本噪声,如错字、漏字、模糊音等,从而影响多模态情感分析模型在现实场景中部署的性能。面对不同类型的噪声,寻求一种通用的解决方案进行统一处理是一项艰巨的任务。在噪声场景下,不同模态之间的一致性可能受到影响,从而增加了选择和融合有效特征的难度。因此,有针对性地解决实际场景中常见的噪声问题显得尤为必要。

2、本专利技术提出面向语音识别噪声场景下多模态情感分析方法,利用情感距离约束来增强文本模态的特征提取并促进其与视频、语音模态融合。具体来说,首先针对文本模态,在模态内通过引导情感强度低的噪声样本靠近同类中心以及情感强度高的样本,让其在情感语义空间中找到合适的位置,从而弥补损失本文档来自技高网...

【技术保护点】

1.面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述方法的具体步骤如下:

2.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述Step1的具体步骤如下:

3.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述Step2的具体步骤如下:

4.根据权利要求3所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述Step2中包括:

5.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述Step3的具体步骤如下:

>6.根据权利要求1...

【技术特征摘要】

1.面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述方法的具体步骤如下:

2.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述step1的具体步骤如下:

3.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述step2的具体步骤如下:

4.根据权利要求3所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述step2中包括:

5.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述step3的具体步骤如下:

6.根...

【专利技术属性】
技术研发人员:余正涛胡子煦郭军军
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1