一种数据管理方法、系统、设备及介质技术方案

技术编号：26730572 阅读：24 留言：0更新日期：2020-12-15 14:31

本发明专利技术公开了一种数据管理方法、装置、设备及存储介质，其特征在于，由集成在实时流计算框架Flink上的数据管理系统执行，包括：解析从分布式消息系统中所拉取的流数据，获得各所述流数据的数据属性信息，其中，各所述流数据具备不同数据来源；采用各所述流数据属性信息匹配的存储策略，将相应的流数据通过预设的时间窗口存储至第一指定数据库中。本发明专利技术基于Flink框架解析不同来源的流数据，获得流数据的数据属性信息，根据数据属性信息存储至指定数据库中，实现了对不同来源的流数据进行指定存储、快速索引和及时流量预警。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据管理方法、系统、设备及介质
本专利技术实施例涉及信息
的数据存储技术，尤其涉及一种数据管理方法、系统、设备及介质。
技术介绍
随着网络技术发展，使得各行各业每秒产出大量连续流数据。海量数据反映了人们的日常规律，如何有效分析和处理海量流数据提取准确的流数据呈现规律和知识，将是数据信息领域重要的技术手段；但海量数据具备：数据量大、数据种类和来源多样化、增长速度快、数据准确性低、数据价值密度相对较低等特性，使得流数据呈现规律和知识的提取并非易事。现有技术中海量数据存储和索引方法中不同来源的流数据处理流程复杂、流数据处理的时效较差、也不能对海量数据处理时的流数据量进行预警。
技术实现思路
本专利技术提供了一种数据管理方法、系统、设备及介质，以实现根据不同来源数据的属性信息，对不同来源的流数据进行指定存储、快速索引和及时流量预警。第一方面，本专利技术实施例提供了一种数据管理方法，由集成在实时流计算框架Flink上的数据管理系统执行，包括：解析从分布式消息系统中所拉取的流数据，获得各所述流数据的数据属性信息，其中，各所述流数据具备不同数据来源；采用各所述流数据属性信息匹配的存储策略，将相应的流数据通过预设的时间窗口存储至第一指定数据库中。第二方面，本专利技术实施例还提供了一种数据管理系统，集成在实时流计算框架Flink上，包括：数据解析模块，用于解析从分布式消息系统中所拉取的流数据，获得各所述流数据的数据属性信息；数据存储模块，用于采用各所述流数据...

【技术保护点】
1.一种数据管理方法，其特征在于，由集成在实时流计算框架Flink上的数据管理系统执行，包括：/n解析从分布式消息系统中所拉取的流数据，获得各所述流数据的数据属性信息，其中，各所述流数据具备不同数据来源；/n采用各所述流数据属性信息匹配的存储策略，将相应的流数据通过预设的时间窗口存储至第一指定数据库中。/n

【技术特征摘要】
1.一种数据管理方法，其特征在于，由集成在实时流计算框架Flink上的数据管理系统执行，包括：
解析从分布式消息系统中所拉取的流数据，获得各所述流数据的数据属性信息，其中，各所述流数据具备不同数据来源；
采用各所述流数据属性信息匹配的存储策略，将相应的流数据通过预设的时间窗口存储至第一指定数据库中。

2.根据权利要求1所述的方法，其特征在于，还包括：
确定所述时间窗口在所对应设定时间戳下的流数据量值，并将所述流数据量值及流经时间段关联存储至第二指定数据库中。

3.根据权利要求2所述的方法，其特征在于，还包括：
实时监测所述设定时间戳下的流数据量值，并当所述流数据量值大于预设流量阈值时，以设定警告形式进行流量负载预警。

4.根据权利要求1所述的方法，其特征在于，解析从分布式消息系统中所拉取的流数据，获得各所述流数据的数据属性信息，包括：
从预设的元数据规则集中确定匹配各所述流数据的目标元数据规则，并采用各所述目标元数据规则处理相应的流数据，获得各所述流数据属性信息。

5.根据权利要求4所述的方法，其特征在于，还包括：
根据各所述流数据的数据属性信息以及相应的目标元数据规则，对存储至所述第一指定数据库的各流数据在指定索引库中建立全文索引。

6.根据权利要求5所述的方法，其特征在于，还包括：

【专利技术属性】
技术研发人员：丁宝存，谢永恒，万月亮，
申请(专利权)人：北京锐安科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人