一种基于深度学习的视频压缩方法技术

技术编号：31513077 阅读：19 留言：0更新日期：2021-12-22 23:54

本发明专利技术提供了一种基于深度学习的视频压缩方法，本视频压缩方法通过采集用户的面部信息以及多个用户之间的关联信息，通过深度学习方式在源视频中识别并分离出基于多个用户的目标画面区域，并将分离出的目标画面进行缓存待用；其后，对源视频进行下采样以及压缩，并将基于用户的目标画面区域重建并合成到压缩后的视频中，使源视频压缩后，同时获得保留有目标用户清晰画面的多个视频；该压缩方法兼顾了视频容量以及画面质量，有利于视频在多个目标用户中传播。用户中传播。用户中传播。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的视频压缩方法

[0001]本专利技术涉及视频处理领域。具体而言，涉及一种基于深度学习的视频压缩方法。

技术介绍

[0002]随着互联网技术的发展以及视频拍摄技术的发展，人们越加喜欢利用视频作为记录形式，并通过将视频经由互联网进行分享，用于为大众分享自身的日常活动情况。以视频为主体的移动多媒体数据因此急剧增长，并且即使随着如高速光纤宽带、移动设备5G技术的增速，视频数据的增加速度仍然超过技术的发展速度，为相关的视频业务领域提出新的挑战。根据Cisco Visual Network Index的统计数据指出，从2017年到2022年期间，全球互联网流量将增长3倍或以上，其中流量繁忙期间的峰值将增长4.8倍以；并随着短视频、在线游戏、远程办公等应用的高速发展，人们对互联网带宽以及减小网络延迟的要求只会越来越高。
[0003]当前不少国家需要重振旅游业，并且需要以更丰富的体验方法和更高质量的服务以重新吸引旅客的消费，当中包括相关旅游园区设计了在游玩区域实时记录游客们的游玩情景，并在游客完成游玩过程后将记录视频发送到游客的移动设备上；更优方案是，将已剪辑完成的视频发送给游客，使游客在完成游玩后，更能对旅游园区留下印象。
[0004]查阅相关地已公开技术方案，公开号为US2021142096 (A1)的技术方案提出利用压缩无人驾驶汽车前摄像头的监控视频内容，用于提高视频流的传输速度，保证后台的操作员可以更快地接管车辆的操作，避免视频延迟带来的交通事故；公开号为US2021090301（A1）提出...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的视频压缩方法，其特征在于，所述压缩方法包括以下步骤：S1：采集至少一个目标用户的面部图像，生成基于目标用户的面部特征；S2：获得至少两个所述目标用户的关联度，组合获得至少一个目标用户群组G；S3：对源视频进行池化，获得第一视频V1；S4：基于所述目标用户的面部特征以及所述目标用户群组G，利用深度学习神经网络对所述第一视频V1进行目标区域和非目标区域划分，对所述目标区域的视频进行分离并缓存，获得目标视频E；S5：对所述第一视频V1的进行指定码率压缩，获得第二视频V2；S6：将所述目标视频E按时序以及坐标的序列合成到所述第二视频V2，获得至少一个第三视频V3；其中，完成步骤S3获得所述第一视频V1后，将所述第一视频V1缓存到多个分布式节点上，由多个分布式节点同时执行步骤S4至S6的处理步骤，分离基于多个所述目标用户的多个所述目标视频，并获得基于多个所述目标用户的所述第三视频V3；分布式节点通过所负责的多个目标用户的联系方式，将对应所述目标用户的所述第三视频V3发送到所述目标用户的设备上。2.根据权利要求1所述一种基于深度学习的视频压缩方法，其特征在于，步骤S1对目标用户进行面部图像采集的方法，包括使用固定拍摄设备以及使用移动设备对用户面部进行拍摄。3.根据权利要求2所述一种基于深度学习的视频压缩方法，其特征在于，步骤S2计算至少两个目标用户的关联度，包括由用户提供与其他用户的关系信息；包括在步骤S1中至少两个有关联的用户进行同时拍摄并采集面部图像。4.根据权利要求3所述一种基于深度学习的视频压缩方法，其特征在于，步骤S3中，使用深度学习神经网络对源视频进行池化下采样。5.根据权利要求4所述一种基于深度学...

【专利技术属性】
技术研发人员：张卫平，丁烨，岑全，李显阔，
申请(专利权)人：环球数科集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人