【技术实现步骤摘要】
本公开涉及多模态学习,尤其涉及一种多模态融合深度学习分析方法及系统。
技术介绍
1、在数字化信息爆炸式增长的背景下,单一模态数据已难以满足复杂场景下精准分析的需求。图像数据仅能呈现视觉表象而缺乏语义关联,文本信息难以直观反映实体间空间关系,音视频数据则存在时序特征与频谱特征分离处理的局限性。
2、传统多模态处理技术种,图像处理停留在灰度化、去噪等预处理层面,文本处理局限于分词与词向量转换,音频处理仅提取mfcc等基础频谱特征,视频分析则简单提取关键帧并孤立处理同步音频。特征融合阶段普遍采用特征拼接或加权求和等浅层方法。
3、但独立提取的视觉特征、语义特征和频谱特征仅保留各模态原始信息,未能捕捉模态间的互补性与矛盾性;简单的特征拼接策略导致高维特征空间冗余信息激增,反而降低模型泛化能力;孤立处理流程破坏了音视频数据天然的时序同步性,关键帧提取与音频分析的分离操作造成时序特征断裂。
技术实现思路
1、为了解决现有技术的不足,本公开提供了一种多模态融合深度学习分析方法及系
...【技术保护点】
1.一种多模态融合深度学习分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,其中,根据视觉特征、语义特征、频谱与时序特征、图像特征、时序特征以及时域特征进行特征融合处理,得到多模态特征,包括:
3.根据权利要求1所述的方法,其特征在于,其中,在得到多模态分析结果之后,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,其中,在根据所述采集质量状态以及所述原始采集参数集确定更新采集参数集之后,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,其中,根据资源适应性调整策略进行模
...【技术特征摘要】
1.一种多模态融合深度学习分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,其中,根据视觉特征、语义特征、频谱与时序特征、图像特征、时序特征以及时域特征进行特征融合处理,得到多模态特征,包括:
3.根据权利要求1所述的方法,其特征在于,其中,在得到多模态分析结果之后,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,其中,在根据所述采集质量状态以及所述原始采集参数集确定更新采集参数集之后,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,其中,根据资源适应性调整策略进行模态采集参数调整处理,得到各数据采集通道的优化采集参数,包括:
6.根据权利要求1所述的方法...
【专利技术属性】
技术研发人员:董爱平,戴晔,刘世闻,顾璇,皋超,严典范,
申请(专利权)人:江苏风云科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。