一种大规模视频帧储存系统、设备和储存介质技术方案

技术编号:38758853 阅读:13 留言:0更新日期:2023-09-10 09:43
本发明专利技术公开了一种大规模视频帧储存系统、设备和储存介质,包括一级存储区、临时存储区、二级存储区和永久存储区;一级存储区对所获取的视频帧实时储存,并基于一级存储区中储存的视频帧进行实时数据分析;临时存储区接收一级存储区中过期的视频帧;二级存储区接收临时存储区的批次视频帧包,并从临时存储区中删除该批次视频帧包;永久存储区用于储存长周期数据分析结果,所述长周期数据分析结果通过抽取所述二级存储区中储存的部分视频帧分析得到;该视频帧储存系统在保证系统性能不变的条件下减少系统中的元数据量,大幅缩减存储集群的规模,从而降低系统的建设成本。从而降低系统的建设成本。从而降低系统的建设成本。

【技术实现步骤摘要】
一种大规模视频帧储存系统、设备和储存介质


[0001]本专利技术涉及视频储存
,尤其涉及一种大规模视频帧储存系统、设备和储存介质。

技术介绍

[0002]学情分析系统旨在对高校校园内数千路摄像头的视频监控数据进行大范围、长周期的分析与数据挖掘,从而发现一些潜在的规律,帮助校方管理人员深入地了解学校的教育教学状况。例如,学生画像功能可以帮助校方了解学生的心理状态、异常行为分析功能能够及时发现各类安全风险并发出告警、安防分析功能可以提供详细的实时分析数据,包括:人员分布、行走轨迹、车辆追踪等。
[0003]以1000路摄像头为例,每秒抽取一帧关键帧图像作为分析算法的输入,一天内需要入库的帧文件数量是8640万个,一年内需要存储的帧文件数量是315亿个。单个视频帧文件数据量平均100KB左右,一年总数据存储量约为3PB。学情分析算法需要频繁地从存储系统中获取某些视频帧数据,并将其下载到本地,然后进行分析,因此对存储系统的访问速度也提出了较高的要求,现有的做法是使用大规模存储集群,对于具有1000路摄像头规模的学情分析系统,至少需要100台服务器规模的存储集群,成本极高。
[0004]因而由于视频数据量大,要做到数千路视频数据的长周期分析与数据挖掘必须解决海量数据存储与快速访问的难题。目前市面上并无解决这一问题的成熟方案。

技术实现思路

[0005]基于
技术介绍
存在的技术问题,本专利技术提出了一种大规模视频帧储存系统、设备和储存介质,在保证系统性能不变的条件下减少系统中的元数据量,大幅缩减存储集群的规模,从而降低系统的建设成本。
[0006]本专利技术提出的一种大规模视频帧储存系统,包括一级存储区、临时存储区、二级存储区和永久存储区;一级存储区对所获取的视频帧实时储存,并基于一级存储区中储存的视频帧进行实时数据分析;临时存储区接收一级存储区中过期的视频帧;二级存储区接收临时存储区的批次视频帧包,并从临时存储区中删除该批次视频帧包,所述批次视频帧包为每隔设定时间对临时存储区中过期的视频帧进行合并压缩后的压缩包;永久存储区用于储存长周期数据分析结果,所述长周期数据分析结果通过抽取所述二级存储区中储存的部分视频帧分析得到。
[0007]进一步地,基于Yarn批处理程序对临时存储区中过期的视频帧进行合并压缩,将合并压缩后的批次视频帧包输送到二级存储区,Yarn批处理程序对视频帧的合并过程具体如下:
[0008]在Yarn集群上运行MapReduce程序,基于Yarn集群中单个服务器配置的内存大小和CPU核心数量,根据待合并的视频帧数据文件的数据量,由Yarn集群向一至多个服务器动态分配计算资源,每个服务器生成一个数据文件和一个索引信息;
[0009]将数据文件和索引文件储存于二级存储区中特定的路径下,在Map的过程中完成视频帧文件数据的读取,在Reduce过程中完成数据文件的合并和索引信息的收集,得到合并压缩包,合并压缩包中包含一个索引文件和多个数据文件,所述索引文件中记录了该压缩包中的视频帧文件覆盖的时间戳,各个时间戳对应目录下的视频帧文件,以及各视频帧文件的数据内容在数据文件中的位置,所述数据文件是多个视频帧文件的二进制字节流简单拼接得到的文件;
[0010]将合并压缩包命名方式为:<起始时间戳>

<结束时间戳>,并将合并压缩包作为批次视频帧包,其中起始时间戳是本批合并的视频帧文件的生成时间的最小值,结束时间戳是本批合并的视频帧文件的生成时间的最大值。
[0011]进一步地,在Reduce过程中完成数据文件的合并和索引信息的收集中,具体包括:
[0012]Reduce过程的返回值包括部分视频帧文件拼接成的字节数组和索引表;
[0013]在Reduce的遍历过程中,视频帧文件被逐步合并到字节数组中,索引表逐渐增大,Reduce执行完毕后,将字节数组保存为数据文件,将索引表保存为索引文件。
[0014]进一步地,基于中间程序文件抽取所述二级存储区中储存的部分视频帧以进行长周期数据分析,中间程序文件对部分视频帧的抽取过程具体如下:
[0015]二级储存区中储存的批次视频帧包以<起始时间戳>

<结束时间戳>命名;
[0016]获取二级存储区中所有子目录列表,并按照起始时间戳从小到大进行排序;
[0017]遍历该排序后的子目录列表,找到满足任一项时间条件的批次视频帧包,并将满足时间条件的批次视频帧包的目录名写入一个视频列表中;
[0018]扫描所述视频列表中各批次视频帧包中的索引文件,找到长周期数据分析所需的各历史视频帧文件对应的摄像头编号、数据文件路径和偏移量,写入待下载列表,所述偏移量包括起始位置和结束位置;
[0019]根据摄像头编号、数据文件路径和偏移量,从二级存储区中下载视频帧数据文件;
[0020]将下载到的视频帧数据文件保存到调用者本地磁盘目录中,文件后缀名为.jpg;
[0021]基于本地磁盘中储存的历史视频帧文件进行长周期数据分析,使用完毕后自行删除。
[0022]进一步地,在扫描所述视频列表中各批次视频帧包中的索引文件,找到长周期数据分析所需的各历史视频帧文件对应的摄像头编号、数据文件路径和偏移量,写入待下载列表中,找到长周期数据分析所需的各历史视频帧文件对应的摄像头编号、数据文件路径和偏移量,具体包括如下:
[0023]针对某个批次视频帧包,将该批次视频帧包对应的索引文件读入内存,得到内存形式的索引表;
[0024]遍历所述索引表中各个数据文件的描述信息,如果数据文件的描述信息对应的历史视频帧的生成时间在长周期数据分析的查询范围内,且对应的摄像头编号也在所述视频列表中,则找到长周期数据分析所需的某一历史视频帧文件;
[0025]获取所述批次视频帧包文件描述信息中对应的摄像头编号、数据文件路径和偏移量,并写入待下载列表中;
[0026]遍历视频列表中的批次视频帧包,得到长周期数据分析所需的各历史视频帧文件对应的摄像头编号、数据文件路径和偏移量。
[0027]进一步地,所述时间条件包括:a1)起始时间小于等于查询时间下限,且结束时间大于等于查询时间下限;a2)起始时间大于等于查询时间下限,且结束时间小于等于查询时间上限;a3)起始时间小于等于查询时间上限,且结束时间大于等于查询时间上限。
[0028]一种大规模视频帧储存设备,所述视频帧储存设备包括储存器、处理器及储存在储存器上并可在所述处理器上运行的视频帧储存程序,所述视频帧储存程序配置一级存储区、临时存储区、二级存储区和永久存储区用于实现如上所述的大规模视频帧储存系统。
[0029]一种计算机可读储存介质,所述计算机可读储存介质上存储有若干分类程序,所述若干分类程序用于被处理器调用并执行如上所述的大规模视频帧储存系统。
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大规模视频帧储存系统,其特征在于,包括一级存储区、临时存储区、二级存储区和永久存储区;一级存储区对所获取的视频帧实时储存,并基于一级存储区中储存的视频帧进行实时数据分析;临时存储区接收一级存储区中过期的视频帧;二级存储区接收临时存储区的批次视频帧包,并从临时存储区中删除该批次视频帧包,所述批次视频帧包为每隔设定时间对临时存储区中过期的视频帧进行合并压缩后的压缩包;永久存储区用于储存长周期数据分析结果,所述长周期数据分析结果通过抽取所述二级存储区中储存的部分视频帧分析得到。2.根据权利要求1所述的大规模视频帧储存系统,其特征在于,基于Yarn批处理程序对临时存储区中过期的视频帧进行合并压缩,将合并压缩后的批次视频帧包输送到二级存储区,Yarn批处理程序对视频帧的合并过程具体如下:在Yarn集群上运行MapReduce程序,基于Yarn集群中单个服务器配置的内存大小和CPU核心数量,根据待合并的视频帧数据文件的数据量,由Yarn集群向一至多个服务器动态分配计算资源,每个服务器生成一个数据文件和一个索引信息;将数据文件和索引文件储存于二级存储区中特定的路径下,在Map的过程中完成视频帧文件数据的读取,在Reduce过程中完成数据文件的合并和索引信息的收集,得到合并压缩包,合并压缩包中包含一个索引文件和多个数据文件,所述索引文件中记录了该压缩包中的视频帧文件覆盖的时间戳,各个时间戳对应目录下的视频帧文件,以及各视频帧文件的数据内容在数据文件中的位置,所述数据文件是多个视频帧文件的二进制字节流简单拼接得到的文件;将合并压缩包命名方式为:<起始时间戳>

<结束时间戳>,并将合并压缩包作为批次视频帧包,其中起始时间戳是本批合并的视频帧文件的生成时间的最小值,结束时间戳是本批合并的视频帧文件的生成时间的最大值。3.根据权利要求2所述的大规模视频帧储存系统,其特征在于,在Reduce过程中完成数据文件的合并和索引信息的收集中,具体包括:Reduce过程的返回值包括部分视频帧文件拼接成的字节数组和索引表;在Reduce的遍历过程中,视频帧文件被逐步合并到字节数组中,索引表逐渐增大,Reduce执行完毕后,将字节数组保存为数据文件,将索引表保存为索引文件。4.根据权利要求2所述的大规模视频帧储存系统,其特征在于,基于中间程序文件抽取所述二级存储区中储存的部分视频帧以进行长周期数据分析,中间程序文件对部分视频帧的抽取过程具体如下:二级储存区中储存的批次视频帧包以<起始时间戳&a...

【专利技术属性】
技术研发人员:张兰曹长虎
申请(专利权)人:合肥综合性国家科学中心人工智能研究院安徽省人工智能实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1