一种基于场景或特定对象的即时视频合成方法与系统技术方案

技术编号：17661033 阅读：22 留言：0更新日期：2018-04-08 12:22

本发明专利技术，“一种基于场景或特定对象的即时视频合成方法与系统”，提供了一种在视频播放过程中根据当前视频的内容进行视频合成或切换的系统及方法，通过对视频节目的内容包括对象、场景、行为等进行分析，根据分析结果及播放要求在播放过程中插入或叠加与原视频内容相似或相关的其它内容，达到在播放过程中对视频内容进行修改或增加的系统及方法。对于离线或在线视频，均能实现视频内容的修改，同时所修改的部分能够以与原视频画面在风格、表现形式及内容近似或相关的形式表现出来，避免对原视频内容、表现形式及情节产生过大的破坏或干扰。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于场景或特定对象的即时视频合成方法与系统
本专利技术总体上涉及一种在视频播放过程中根据当前视频的内容进行视频合成或切换的系统及方法，特别的，本专利技术涉及一种对视频节目的内容进行分析，根据分析结果及播放要求在播放过程中插入或叠加相关内容与当前视频进行合成，从而在播放过程中对视频内容进行修改或增加的系统及方法。
技术介绍
信息技术的发展，特别是网络技术的进步使得视频节目的内容及其呈现形式日益多样、灵活。在视频节目的播放过程中穿插或叠加其它音视频或图片及文字是目前所有视频播放平台获取广告收入的主要手段。由于视频内容的非结构化特性，目前普遍的做法仅限于在指定的时间段(或视频帧)进行内容的切换或叠加。所切换或叠加的内容通常与正在播放的内容无关，很难做到根据正在播放的节目内容有选择性的切换或叠加相关内容。这种生硬的内容切换或叠加在很大程度上破坏了所播放节目的完整性，不仅严重影响观众观看体验，造成观众流失，也无法达到精准的广告或宣传效果。近年来，人工智能、机器学习特别是深度学习的技术有了长足的进步，使得对非结构化的数据如声音、图像甚至视频内容进行更加深入的分析、处理成为可能，由此可以产生出一系列新型的应用形态和商业模式。本专利技术所提供的技术将最新的深度学习理论和技术应用到视频内容的自动化分析中，通过对视频内容中所包含的音视频场景及对象的属性进行分析，根据分析出的场景或属性选择内容和/或形式相关的其它音视频或图片资源与正在播放的视频进行合成或切换。同时，本专利技术还提供了基于上述技术所构建的视频应用系统，用于对视频内容进行分析并将分析结果应用于播放时相关内容的插...
一种基于场景或特定对象的即时视频合成方法与系统

【技术保护点】
一种基于场景或特定对象的即时视频合成系统，亦即通过分析视频画面中特定的“对象”、“场景”、“行为”等，在播放过程中插入或叠加相关内容与当前视频进行合成，从而实现在播放过程中对视频内容进行修改或增加。其中所述“对象”是指视频画面中用户所关心的任何部分或其组合，如人物，车辆，花园，或人物的服饰等，“场景”是指视频画面所表现的环境或氛围，如海边，会议，婚礼等或视频所表现的故事情节，“行为”是指视频画面中上述“对象”的动作，如汽车移动，人抬腕看表等。

【技术特征摘要】
1.一种基于场景或特定对象的即时视频合成系统，亦即通过分析视频画面中特定的“对象”、“场景”、“行为”等，在播放过程中插入或叠加相关内容与当前视频进行合成，从而实现在播放过程中对视频内容进行修改或增加。其中所述“对象”是指视频画面中用户所关心的任何部分或其组合，如人物，车辆，花园，或人物的服饰等，“场景”是指视频画面所表现的环境或氛围，如海边，会议，婚礼等或视频所表现的故事情节，“行为”是指视频画面中上述“对象”的动作，如汽车移动，人抬腕看表等。2.一种权利要求1所述系统，根据预设的目标(“对象”、“场景”、“行为”等)，非实时(离线)分析的系统，其中包括目标设定、图像采集、深度学习网络、帧与帧上下文分析等模块。3.一种权利要求1所述系统，在播放时根据设定的目标(“对象”、“场景”、“行为”等)以及呈现方式进行视频合成的系统。4.一种权利要求1所述系统，根据预设的目标(“对象”、“场景”、“行为”等)，实时(在线)分析的系统，并根据设定的目标(“对象”、“场景”、“行为”等)以及呈现方式实时进行视频合成的系统。5.一种权利要求2所述系统，根据帧与帧之间的上下文关系对预设目标进行修正的装置。6.一种基于场景或特定对象的即时视频合成方法，亦即通过分析视频画面中特定的“对象”、“场景”、“行为”等，在播放过程中插入或叠加相关内容与当前视频进...

【专利技术属性】
技术研发人员：宋松，许怡洋，张岳，马超杰，闫军，
申请(专利权)人：北京视连通科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人