【技术实现步骤摘要】
超大规模NFV网络资源池海量数据处理及数据接入方法
[0001]本专利技术涉及移动通信领域,尤其涉及一种超大规模NFV网络资源池海量数据处理及数据接入方法。
技术介绍
[0002]在移动通信领域,NFV(网络功能虚拟化)技术的引入,利用IT虚拟化技术,将现有的网络设备功能整合进标准的IT通用设备中,以VNF(虚拟网络功能)的形式提供,实现了网络功能与专用硬件设备的脱离,降低了硬件成本,提升了业务创新的速度。为支撑大范围的通信业务,运营商会建设多地多节点符合MANO架构(网络功能虚拟化管理和编排)的超大规模NFV网络资源池,资源池内厂家型号各异且数量巨大的IT设备,以及MANO网络功能虚拟化管理和编排架构复杂的分层接口,每天会产生海量的数据,如何处理这些海量数据,并从中分析资源池的运行状态,是资源池运维工作面临的难题。
[0003]支撑NFV网络资源池运行分析的运维系统,需要对以上海量的数据进行高效正确的处理,同时支撑各种灵活多变的实时多维分析需求,会面临以下难题:
[0004]数据处理架构不清晰,数据处理限入无所适从的局面,缺少公共数据的提炼和汇总,出现烟囱式重复建设,同时也加剧了数据孤岛的问题;孤岛式的建设,缺少统一的组织及方法论,指标口径不统一、数据表级字段名不一致,数据有二义性;当不同业务之间有数据交叉的场景时,为了尽快响应业务需求,直接从其他业务明细层甚至原始数据层获取数据,不同的研发团队不同规范,造成模型设计不统一,复用性差;缺少公共聚合数据的沉淀和积累,数据开效率差,响应慢;
[0 ...
【技术保护点】
【技术特征摘要】
1.一种大规模NFV网络资源池海量数据处理方法,其特征在于,所述方法包括:从MongoDB获得Doris表模型的映射配置,根据所述映射配置对所述海量数据进行数据分层获得ODS、DWD、DWS以及ADS的数据层;对大规模NFV网络资源池产生的数据文件进行解析,获得文件流并推送至Kafka分布式消息队列;基于Flink对Kafka分布式消息队列进行调度,将所述文件流分别推送至各个数据层进行数据处理;所述数据处理,包括,利用Kafka将文件流输入ODS层的Duplicate模型进行存储得到用于数据追溯、没有聚合需求的第一数据,并将所述第一数据推送至Kafka;所述第一数据为明细数据,重复上报的明细数据由所述Duplicate表模型接收并直接保存;利用Kafka按照预设规则对所述第一数据进行清洗,输入DWD层中的Aggregate模型采用REPLACE方式聚合,得到第二数据,并将所述第二数据推送至Kafka;所述第二数据包括资源类数据和性能数据,所述任一资源类数据单独对应一条资源拓扑关系进行缓存,以供性能数据查询;利用Kafka将所述性能数据输入DWS层的Aggregate表模型,利用Doris对所述性能数据按照预定需求,采用SUM、MAX、MIN方式,进行实时预汇聚得到第三数据;获取应用层需求,根据所述需求对DWS层的Aggregate表模型中的第三数据和包括空间类数据的其他维度数据,通过创建物化视图的方式进行实时汇聚并保存至ADS层的Aggregate或Duplicate表模型中。2.根据权利要求1所述的大规模NFV网络资源池海量数据处理方法,其特征在于,所述海量数据,包括:所述大规模NFV网络资源池中物理设备、虚拟设备、虚拟网络功能每天所产生的资源、性能、告警、巡检数据,以及网络功能虚拟化管理和编排架构中的分层接口所上报的资源、性能、告警数据。3.根据权利要求1所述的大规模NFV网络资源池海量数据处理方法,其特征在于,所述解析,包括:对所述数据文件进行解析,获得数据文件消息流并推送至Kafka分布式消息队列;利用Flink接收所述数据文件消息流,进行解析得到文件流;逐行读取所述文件流并输入到Flink数据处理列队;所述文件流包括各类文件混合打散的数据消息;Flink处理流接收文件流,根据数据分区广播的所述映射配置将所述文件流汇总切分为小份数据流;根据各个数据层的表名对所述小份数据流进行分区标识并利用HASH流向Flink开窗处理算子。4.根据权利要求3所述的大规模NFV网络资源池海量数据处理方法,其特征在于,所述调度,包括:利用Flink的Sink算子对哈希流进行批处理,所述批处理每5秒汇总一批;基于Flink对Kafka分布式消息队列进行调度,将批处理后的数据通过数据流的方式保存至Doris...
【专利技术属性】
技术研发人员:伍闵,钟世钦,董威,李超超,王松磊,陈延廷,罗晓惠,杨克伟,胡剑,
申请(专利权)人:杭州东方通信软件技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。