温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种基于张量和互信息的多模态数据融合方法和设备,包括:数据预处理:获取多模态视频语料库,对语料库中视频片段进行预处理,包括文本、视觉、语音三种模态的数据,分割完整数据集为训练集和测试集;单模态表示学习:学习更细粒度的单模态的特征...该专利属于湖北楚天高速数字科技有限公司所有,仅供学习研究参考,未经过湖北楚天高速数字科技有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种基于张量和互信息的多模态数据融合方法和设备,包括:数据预处理:获取多模态视频语料库,对语料库中视频片段进行预处理,包括文本、视觉、语音三种模态的数据,分割完整数据集为训练集和测试集;单模态表示学习:学习更细粒度的单模态的特征...