一种基于深度学习的视频压缩存储方法技术

技术编号:38659777 阅读:15 留言:0更新日期:2023-09-02 22:44
本发明专利技术实施例涉及视频压缩技术领域,具体涉及一种基于深度学习的视频压缩存储方法。将视频的任意一帧作为基准帧,提取基准帧图像特征后对提取的特征进行排序,得到基准帧特征序列;将基准帧的下一帧作为待对比帧,提取待对比帧图像特征后对提取的特征进行排序,得到待对比帧特征序列;将待对比帧特征序列与所述基准帧特征序列进行对比,确定出下一次对比的基准帧或删除所述待对比帧。本发明专利技术采用基准帧和待对比帧相似度的判断方式,将相似度高的帧删除,从而达到视频信息的压缩存储。通过提取基准帧和待对比帧的图像特征,并进行排序,可以大幅度减少计算量和冗余数据,提高处理效率。提高处理效率。提高处理效率。

【技术实现步骤摘要】
一种基于深度学习的视频压缩存储方法


[0001]本专利技术实施例涉及视频压缩
,具体涉及一种基于深度学习的视频压缩存储方法。

技术介绍

[0002]在传统的视频压缩技术中,编码器将视频帧转换成一系列压缩数据,以减少存储空间和传输带宽。然而,这些压缩算法通常需要大量的计算资源,且解码速度较慢,在实际应用场景中例如移动设备、虚拟现实设备和无人驾驶汽车等存在限制。
[0003]因此,需要提供一种新的视频压缩存储方法,能够针对不同的场景和设备进行优化,能够同时提高压缩率和保持解码速度。

技术实现思路

[0004]鉴于上述问题,本专利技术实施例提供了一种基于深度学习的视频压缩存储方法,用于解决现有技术中存在的针对不同的场景和设备进行优化,能够同时提高压缩率和保持解码速度的问题。
[0005]根据本专利技术实施例的一个方面,提供了一种基于深度学习的视频压缩存储方法,所述方法包括:
[0006]获取视频,将视频的任意一帧作为基准帧,提取基准帧图像特征后对提取的特征进行排序,得到基准帧特征序列;
[0007]将基准帧的下一帧作为待对比帧,提取待对比帧图像特征后对提取的特征进行排序,得到待对比帧特征序列;
[0008]将待对比帧特征序列与所述基准帧特征序列进行对比;若对比相似度小于设定的相似度阈值,将所述待对比帧作为下一次对比的基准帧;若对比相似度大于等于设定的相似度阈值,则删除所述待对比帧。
[0009]在一种可选的方式中,所述基准帧特征序列包括横纵坐标、角度、尺寸、特征金字塔层。
[0010]在一种可选的方式中,对所有的基准帧进行语音转文本识别,获得所述视频的视觉文本标识。
[0011]在一种可选的方式中,对所述所有的基准帧和视觉文本标识进行拼接,得到融合的视频文本特征。
[0012]在一种可选的方式中,采用自注意力机制将所述视觉文本标识进行融合,得到第一融合特征;
[0013]分别确定所述第一融合特征与所述基准帧特征序列的相似度,并从多个基准帧特征序列中确定出相似度大于等于设定的相似度阈值的融合基准帧。
[0014]在一种可选的方式中,按照各所述融合基准帧的时间顺序进行拼接,得到融合的压缩视频。
[0015]在一种可选的方式中,按照各所述融合基准帧的相似度顺序进行拼接,得到融合的压缩视频。
[0016]根据本专利技术实施例的另一方面,提供了一种提高坡道行驶安全性的装置,包括:
[0017]采集模块,用于获取视频,将视频的任意一帧作为基准帧,提取基准帧图像特征后对提取的特征进行排序,得到基准帧特征序列;
[0018]提取模块,用于将基准帧的下一帧作为待对比帧,提取待对比帧图像特征后对提取的特征进行排序,得到待对比帧特征序列;
[0019]对比模块,用于将待对比帧特征序列与所述基准帧特征序列进行对比;若对比相似度小于设定的相似度阈值,将所述待对比帧作为下一次对比的基准帧;若对比相似度大于等于设定的相似度阈值,则删除所述待对比帧。
[0020]根据本专利技术实施例的另一方面,提供了一种基于深度学习的视频压缩存储设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0021]所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述任意一项所述的一种基于深度学习的视频压缩存储方法的操作。
[0022]根据本专利技术实施例的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述一种基于深度学习的视频压缩存储设备/装置上运行时,使得一种基于深度学习的视频压缩存储设备/装置执行上述任意一项所述的一种基于深度学习的视频压缩存储的操作。
[0023]本专利技术实施例通过深度学习的视频高效压缩存储,采用基准帧和待对比帧相似度的判断方式,将相似度高的帧删除,从而达到视频信息的压缩存储。通过提取基准帧和待对比帧的图像特征,并进行排序,可以大幅度减少计算量和冗余数据,提高处理效率。当相邻两帧相似度小于设定的相似度阈值时,将待对比帧作为下一次对比的基准帧。这种自适应的策略可以更好地适应视频场景的变化例如行车记录,提高系统的稳定性和鲁棒性。
[0024]上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0025]附图仅用于示出实施方式,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0026]图1示出了本专利技术提供的一种基于深度学习的视频压缩存储方法的实施例的流程示意图。
具体实施方式
[0027]下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。
[0028]图1示出了本专利技术一种基于深度学习的视频压缩存储方法的第一实施例的流程
图,该方法由一种基于深度学习的视频压缩存储装置执行。如图1所示,该方法包括以下步骤:
[0029]步骤110:获取视频,将视频的任意一帧作为基准帧,提取基准帧图像特征后对提取的特征进行排序,得到基准帧特征序列。
[0030]其中,基准帧特征序列包括了横纵坐标、角度、尺寸、特征金字塔层。
[0031]例如:可以使用深度学习中的目标检测算法,如Faster R

CNN、YOLO等来实现对视频帧中物体的检测和跟踪。基于这些算法,在获取视频并将任意一帧作为基准帧后,可以对基准帧进行目标检测和跟踪,得到在该帧中出现的物体的位置、尺寸、角度等信息。对每一个检测到的物体,利用卷积神经网络(CNN)模型在其周围采样一定数量的区域,提取特征向量。这些特征向量可以表示该物体的颜色、纹理、形状等信息。将所有检测到物体的特征向量按照物体位置依次排序,得到基准帧特征序列。在提取特征时,可以使用特征金字塔来多尺度地提取特征,以适应不同尺寸的物体。
[0032]步骤120:将基准帧的下一帧作为待对比帧,提取待对比帧图像特征后对提取的特征进行排序,得到待对比帧特征序列。
[0033]其中,这些待对比帧特征序列可以是例如语音识别、说话人识别、情感分析等。在进行语音相关任务时,需要比较两个语音信号的特征序列,以判断它们是否相似或属于同一个类别。
[0034]步骤130:将待对比帧特征序列与所述基准帧特征序列进行对比;若对比相似度小于设定的相似度阈值,将所述待对比帧作为下一次对比的基准帧;若对比相似度大于等于设定的相似度阈值,则删除所述待对比帧。
[0035]其中,对所有的基准帧进行语音转文本识别,获得所述视频的视觉文本标识。
[0036]例如:从基准帧中进行特征提取,得到帧特征序列。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的视频压缩存储方法,其特征在于,所述方法包括:获取视频,将视频的任意一帧作为基准帧,提取基准帧图像特征后对提取的特征进行排序,得到基准帧特征序列;将基准帧的下一帧作为待对比帧,提取待对比帧图像特征后对提取的特征进行排序,得到待对比帧特征序列;将待对比帧特征序列与所述基准帧特征序列进行对比;若对比相似度小于设定的相似度阈值,将所述待对比帧作为下一次对比的基准帧;若对比相似度大于等于设定的相似度阈值,则删除所述待对比帧。2.根据权利要求1所述的方法,其特征在于,所述基准帧特征序列包括横纵坐标、角度、尺寸、特征金字塔层。3.根据权利要求1所述的方法,其特征在于,对所有的基准帧进行语音转文本识别,获得所述视频的视觉文本标识。4.根据权利要求3所述的方法,其特征在于,对所述所有的基准帧和视觉文本标识进行拼接,得到融合的视频文本特征。5.根据权利要求3所述的方法,其特征在于,采用自注意力机制将所述视觉文本标识进行融合,得到第一融合特征;分别确定所述第一融合特征与所述基准帧特征序列的相似度,并从多个基准帧特征序列中确定出相似度大于等于设定的相似度阈值的融合基准帧。6.根据权利要求5所述的方法,其特征在于,按照各所述融合基准帧的时间顺序进行拼接,得到融合的压缩视频。7.根据权利要求5所述的方法,其特征在于,按照各所述融合基准帧的相...

【专利技术属性】
技术研发人员:童译
申请(专利权)人:云车智途重庆科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1