【技术实现步骤摘要】
一种码流数据管理方法、装置及存储介质
本专利技术涉及信息处理
,尤其涉及一种码流数据管理方法、装置及计算机可读存储介质。
技术介绍
大数据时代,随着移动网、互联网、物联网、车联网等技术日新月异,各种网络设备,各类用户终端呈现爆炸式发展,终端和设备之间,设备与设备之间会实时生成海量的码流数据。码流的数据的特点是:种类繁多,数据量大,日增速度快,一个小的子系统,一天的码流总量可能就是TB级,甚至PB级。回溯原始码流是必然的需求,如何高效存储,快速反查码流变得越来越困难。现有解决码流存取的方案,最常用的是把TID(TransactionIdentifier)存储在关系或非关系型数据库,把原始码流存储在HBase等大数据集群,然后利用HBase的各类接口,通过TID来进行关联查询。但是HBase存储时集群本身的开销大,导致存储时资源占用过高,查询时任务启动时间太长,任务响应不及时。为了提高HBase等大数据集群的码流存取效率,需要不断增加存储和计算设备,最终导致HBase集群自身产品成本和运维成本不断升高,而用户体验却 ...
【技术保护点】
1.一种码流数据管理方法,所述方法包括:/n解析待存储数据,得到所述待存储数据的数据标识和时间戳;/n根据所述数据标识,生成所述待存储数据的数据文件名称和索引文件名称;/n根据所述时间戳,生成所述待存储数据的分区存储路径;/n根据数据文件名称、索引文件名称和所述分区存储路径,对所述待存储数据进行分区存储;/n在接收到数据查询请求时,响应于所述数据查询请求,进行数据检索。/n
【技术特征摘要】
1.一种码流数据管理方法,所述方法包括:
解析待存储数据,得到所述待存储数据的数据标识和时间戳;
根据所述数据标识,生成所述待存储数据的数据文件名称和索引文件名称;
根据所述时间戳,生成所述待存储数据的分区存储路径;
根据数据文件名称、索引文件名称和所述分区存储路径,对所述待存储数据进行分区存储;
在接收到数据查询请求时,响应于所述数据查询请求,进行数据检索。
2.根据权利要求1所述的方法,所述解析待存储数据,得到所述待存储数据的数据标识和时间戳,包括:
将所述待存储数据转换为指定数据格式;
对所述指定格式的待存储数据进行解析,得到所述待存储数据的以下至少之一:
事务标识TID,包括所述待存储数据的事件的时间戳和递增序列;
用户标识UID,包括所述待存储数据的用户身份标识和时间戳。
3.根据权利要求1所述的方法,所述根据所述数据标识,生成所述待存储数据的数据文件名称和索引文件名称,包括:
根据所述数据标识和所述时间戳,进行哈希处理,得到相应的所述待存储数据的索引文件名和数据文件名。
4.根据权利要求1所述的方法,所述根据数据文件名称、索引文件名称和所述分区存储路径,对所述待存储数据进行分区存储,包括:
根据Cache数据所配置的块大小,为所述待存储数据分配内存资源;
根据所述分区存储路径,确定所述待存储数据的Cache索引文件和Cache数据文件;
对所述待存储数据进行压缩,并以所述数据文件名将压缩后的待存储数据按顺序存储至所述Cache数据文件中;
确定所述待存储数据在所述数据文件中的缓存位置;
在Cache数据的索引文件中构建所述索引文件名与所述数据文件名和缓存位置的映射。
5.根据权利要求4所述的方法,所述方法还包括:
每间隔设定周期,根据Cache数据中所存储的数据包的时间戳,确定所述时间戳对应的时间点与当前...
【专利技术属性】
技术研发人员:何全安,方宗虎,郭志涛,
申请(专利权)人:联想未来通信科技重庆有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。