【技术实现步骤摘要】
技术介绍
1、随着社交媒体的发展,人们可以使用多种信息(文字,图片,视频)共同表达情感。在现实生活中,由于用户行为的多样性等干扰因素的存在,经常会遇到部分模态可能缺失的情况,其中以缺少文本模态的无字幕视频最为常见。文本是情感分析中最重要的一个模态,因此为了确保情感预测的准确性,现今常常会借助语音识别技术生成对应的视频字幕。然而,由于语音识别本身的能力限制,可能会在识别过程中引入文本噪声,如错字、漏字、模糊音等,从而影响多模态情感分析模型在现实场景中部署的性能。面对不同类型的噪声,寻求一种通用的解决方案进行统一处理是一项艰巨的任务。在噪声场景下,不同模态之间的一致性可能受到影响,从而增加了选择和融合有效特征的难度。因此,有针对性地解决实际场景中常见的噪声问题显得尤为必要。
2、本专利技术提出面向语音识别噪声场景下多模态情感分析方法,利用情感距离约束来增强文本模态的特征提取并促进其与视频、语音模态融合。具体来说,首先针对文本模态,在模态内通过引导情感强度低的噪声样本靠近同类中心以及情感强度高的样本,让其在情感语义空间中找到合适
...【技术保护点】
1.面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述方法的具体步骤如下:
2.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述Step1的具体步骤如下:
3.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述Step2的具体步骤如下:
4.根据权利要求3所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述Step2中包括:
5.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述Step3的具体步骤如下:
【技术特征摘要】
1.面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述方法的具体步骤如下:
2.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述step1的具体步骤如下:
3.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述step2的具体步骤如下:
4.根据权利要求3所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述step2中包括:
5.根据权利要求1所述的面向语音识别噪声场景下多模态情感分析方法,其特征在于:所述step3的具体步骤如下:
6.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。