一种实时大数据处理系统和方法技术方案

技术编号：33426667 阅读：14 留言：0更新日期：2022-05-19 00:18

本发明专利技术涉及一种实时大数据处理系统和方法，其方法包括：采用异步数据接收组件异步接收、压缩/解压缩数据，将数据发送到多线程数据处理组件；采用多线程数据处理组件解析来自异步数据接收组件的数据报文，异步处理，并批量插入到列式存储数据库；采用角色对等的多个列式存储数据库提供物化视图功能提高存储查询性能。通过数据异步接收，并发解析处理技术，并基于列式存储及相关组件，能够在利用较少系统资源的情况下实时解析、处理、存储、分析应用性能指标数据，提高运维效率。提高运维效率。提高运维效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种实时大数据处理系统和方法

[0001]本专利技术属于应用性能监控领域，尤其是一种实时大数据处理技术，主要用于对监控数据有高吞吐、低延迟的大数据处理分析。

技术介绍

[0002]目前，应用性能监控领域，针对相关探针(agent)实时采集数据，实时高效地接收、处理、存储探针所采集的数据的技术方案，存在硬件资源消耗大、实时性差的问题，较难同时兼顾吞吐率和延迟率。一般来说，要么吞吐率高，但是数据延迟高，难以达到实时性；要么实时性强，但是数据吞吐率低。当二者兼顾时，需要消耗较高的系统资源，所以围绕传统数据接收和处理的方案已经不满足相关性能需求。
[0003]例如，传统的数据接收方案，一般采用BIO模型，即一个线程对应一个请求，这就会导致很多请求线程处于等待io资源的状态，因而无法有效利用。由于创建线程是比较昂贵的系统资源，因此，当并发量增大时，系统的资源负载较大，无法满足高吞吐的要求。另外，传统数据库的单机或主从设计模式，也无法达到对数据库高吞吐和低延迟的要求。

技术实现思路

[0004]为了克服现有技术的上述缺陷，本专利技术一个目的在于提供一种实时大数据处理技术，其基于异步事件模型的异步数据接收，可以实现消耗较小的线程资源，达到较高的数据接收能力。
[0005]本专利技术又一个目的在于提供一种实时大数据处理技术，其列式数据库提供的物化视图功能，可以减少数据条数，提高查询性能。
[0006]本专利技术一个目的在于提供一种实时大数据处理技术，其基于异步事件模型的异步数据接收结合列式数据...

【技术保护点】

【技术特征摘要】
1.一种实时大数据处理系统，其特征在于，其包括：异步数据接收组件，用于异步接收、压缩/解压缩数据，将数据发送到多线程数据处理组件，即分布式数据解析服务组件；多线程数据处理组件，即分布式数据解析服务组件，用于解析来自异步数据接收组件的数据报文，异步处理，并批量插入到列式存储数据库；多个列式存储数据库，各列式存储数据库角色对等，提供物化视图功能。2.如权利要求1所述的实时大数据处理系统，其特征在于，所述异步数据接收组件利用nio技术异步接收、压缩数据。3.如权利要求2所述的实时大数据处理系统，其特征在于，所述异步数据接收组件包括基于异步事件模型，通过提供一个EventLoop组件来统一协调，基于事件驱动，当收到一个事件时，会提供一个线程来处理。4.如权利要求3所述的实时大数据处理系统，其特征在于，当该线程等待io时，该线程可以处理别的任务。5.如权利要求1至4中任一项所述的实时大数据处理系统，其特征在于，多线程数据处理组件为分布式数据解析服务组件。6.如权利要求5所述的实时大数据处理系统，其特征在于，列式存储数据库的物化视图功能包括：当数据写入原始表，会根据数据特征，提前聚合。7.一种实时大数据处理方法，其特征在于，其包括步骤：S1、采用异步数据接收组件异步接...

【专利技术属性】
技术研发人员：赖彩林，韩成冰，
申请(专利权)人：云智慧北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人