分割视频的多模态系统、分割多媒体的多模态系统及方法技术方案

技术编号：36867432 阅读：14 留言：0更新日期：2023-03-15 19:20

本发明专利技术公开了一种用于分割视频的多模态系统、用于分割多媒体的多模态系统、利用多模态系统分割视频的方法和利用多模态系统分割多媒体的方法。多模态分割系统利用光学信息、时间信息和空间信息来增强AR和VR或其他带有准确细节的娱乐目的的分割。该系统可以分割视频帧内的前景目标，例如人和显著目标，并允许定位感兴趣目标以用于多种用途。定位感兴趣目标以用于多种用途。定位感兴趣目标以用于多种用途。

全部详细技术资料下载

【技术实现步骤摘要】
分割视频的多模态系统、分割多媒体的多模态系统及方法

[0001]本专利技术涉及用于实时视频应用程序的视频分割工具。更具体地，涉及一种用于分割多媒体内的人和显著目标等前景目标的多模态系统，该多模态系统允许定位用于多种目的的感兴趣目标。更具体地，本专利技术还涉及一种用于分割视频帧以同时检测目标和跟踪视频帧的方法。专利技术背景
[0002]随着设备计算能力和5G快速通信技术的快速发展，最近对虚拟现实(AV和VR)、在线直播等视频应用程序的需求蓬勃发展。如果机器可以帮助准确地指示视频中的显著目标或前景，则许多应用程序可以进行使用。
[0003]随着图像处理和视频处理的改进，众多应用都需要语义上更有用的表示，例如基于目标的视频编码、视频索引、检索和视频摘要等。
[0004]对前景、有趣事件或异常事件的稳健检测是诸如跟踪、识别和监视之类的许多图像和视频应用程序的重要前提。尽管通常不存在待检测前景目标有关的先验信息，但在很多情况下，背景场景存在于视频的所有帧中。动态背景、移动或由于振动、风等引起的摄像机运动是使前景检测面临重大挑战的重要因素，大多数应用程序都需要视频的实时或准实时检测。这些因素导致前景检测或目标检测非常困难。针对前景检测的背景建模常用于不同应用中，以对背景进行建模，然后检测视频监控等场景中的移动目标。
[0005]视频分割是一项系统任务，目的在于提高视觉质量以获得更好的用户体验。分割视频的目的是改善用户的视觉体验。目前可用的视频分割系统或图像分割系统无法准确地指示视频或图像中的显著目标和前景。因此，...

【技术保护点】

【技术特征摘要】
1.一种用于分割视频的多模态系统，其特征在于，包括：级联细化模块，其中，所述级联细化模块包括：多媒体单元；输入单元，用于从所述多媒体单元接收视频；以及细化单元，用于将一个或多个附加信息连接到所述视频以生成优化视频；背景补全模块，其中，所述背景补全模块包括：捕获单元，用于捕获与所述优化视频相关联的帧以生成视频输出；以及掩模单元，用于基于所述视频输出产生一个或多个掩模；以及处理模块，用于接收并随后处理所述一个或多个掩模，以产生分段视频。2.根据权利要求1所述的多模态系统，其特征在于，所述多模态系统还包括用于记录所述视频的记录器。3.根据权利要求1所述的多模态系统，其特征在于，所述级联细化模块分割所述视频的前景区域。4.根据权利要求1所述的多模态系统，其特征在于，所述背景补全模块还包括通知单元，用于基于对所述视频的背景区域的捕获发送通知。5.根据权利要求4所述的多模态系统，其特征在于，所述通知为拒绝捕获所述背景区域。6.根据权利要求5所述的多模态系统，其特征在于，所述拒绝捕获所述背景区域触发拍摄单元，然后对所述背景区域进行捕获和合成。7.根据权利要求1或4所述的多模态系统，其特征在于，所述背景补全模块还包括拍摄单元，用于拍摄所述视频。8.根据权利要求1所述的多模态系统，其特征在于，所述背景补全模块还包括背景合成模块，用于合成所述背景区域并由所述捕获单元采集所述背景区域。9.根据权利要求7所述的多模态系统，其特征在于，所述通知还允许捕获所述背景区域。10.根据权利要求9所述的多模态系统，其特征在于，所述通知触发所述捕获单元，以捕获所述背景区域，然后由所述拍摄单元拍摄所述视频。11.根据权利要求1所述的多模态系统，其特征在于，所述多媒体单元是数码相机、智能手机、摄像机、平板电脑、网络摄像头、笔记本电脑和iPad中的任一种。12.根据权利要求1所述的多模态系统，其特征在于，所述一个或多个附加信息基于所述视频的背景、前景人物、一致帧、像素、运动图和语义边界中的至少一种。13.根据权利要求1所述的多模态系统，其特征在于，所述一个或多个掩模是基于人工智能AI的掩模。14.根据权利要求1所述的多模态系统，其特征在于，所述处理模块还包括：处理单元，用于利用提取器提取与所述掩模单元生成的一个或多个掩模相关联的一个或多个特征；选择单元，用于从所述一个或多个特征中选择一个或多个主导特征；以及组合单元，其中，所述组合单元组合所述一个或多个主导特征以产生所述分段视频。15.根据权利要求14所述的多模态系统，其特征在于，所述提取器是CNN特征提取器。
16.根据权利要求14所述的多模态系统，其特征在于，所述选择单元自动选择所述一个或多个主导特征。17.根据权利要求16所述的多模态系统，其特征在于，所述选择单元是自适应的。18.一种用于分割多媒体的多模态系统，其特征在于，包括：级联细化模块，其中，所述级联细化模块包括：输入单元，用于从电子设备接收所述多媒体；以及细化单元，用于将一个或多个附加信息连接到所述多媒体以生成优化多媒体；背景补全模块，其中，所述背景补全模块包括：捕获单元，用于捕获与所述...

【专利技术属性】
技术研发人员：屠方闻，李博，
申请(专利权)人：黑芝麻智能科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人