Kafka数据自动化流处理方法及装置制造方法及图纸

技术编号:37872165 阅读:16 留言:0更新日期:2023-06-15 21:01
本公开提供了一种Kafka数据自动化流处理方法,涉及分布式技术领域,可以应用于金融技术领域。该方法包括:接收用户输入的流处理规则信息;对所述流处理规则信息进行校验;以及在确定所述流处理规则信息校验通过后,根据所述流处理规则信息执行流式数据处理。本公开还提供了一种Kafka数据自动化流处理装置、设备、存储介质和程序产品。存储介质和程序产品。存储介质和程序产品。

【技术实现步骤摘要】
Kafka数据自动化流处理方法及装置


[0001]本公开涉及分布式
,具体涉及流处理
,更具体地涉及一种Kafka数据自动化流处理方法、装置、设备、存储介质和程序产品。

技术介绍

[0002]Kafka作为一个高吞吐的分布式消息系统,已经被应用在很多大型公司的实际业务中。虽然Kafka在社区上提供了流处理组件Kafka Streams,但是它不是一个流处理框架,只是一个用来处理流式数据的库,用户想要对Kafka流式数据进行处理需要自己调用相关API实现。这种实现方式对用户不友好,需要用户学习相关API的使用以及异常处理,此外,Kafka Streams提供的API只能对集群内的消息进行处理,缺乏跨集群流处理能力。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]鉴于上述问题,本公开提供了一种服务化、实现跨集群的Kafka数据自动化流处理方法、装置、设备、存储介质和程序产品。
[0005]根据本公开的第一个方面,提供了一种Kafka数据自动化流处理方法,所述方法包括:
[0006]接收用户输入的流处理规则信息;
[0007]对所述流处理规则信息进行校验;以及
[0008]在确定所述流处理规则信息校验通过后,根据所述流处理规则信息执行流式数据处理。
[0009]根据本公开的实施例,所述根据所述流处理规则信息执行流式数据处理包括:
[0010]启动新线程解析所述流处理规则信息;
[0011]根据解析后的流处理规则信息对外提供流处理服务,所述流处理服务用于处理Kafka消息数据。
[0012]根据本公开的实施例,所述启动新线程解析所述流处理规则信息包括:
[0013]根据所述流处理规则信息确定源集群标识、源主题名称、目的集群标识、目的主题名称、规则类型、处理对象和规则具体内容。
[0014]根据本公开的实施例,所述根据解析后的流处理规则信息对外提供流处理服务包括:
[0015]根据源集群标识和源主题确定消息流入目标;
[0016]根据目的集群标识和目的主题确定消息流出目标;
[0017]根据规则类型确定调用的消息处理接口;
[0018]对处理对象和规则具体内容进行解析后作为所述消息处理接口的接口传参;以及
[0019]根据所述消息流入目标、所述消息流出目标和所述接口传参处理Kafka消息数据。
[0020]根据本公开的实施例,所述流处理规则信息还包括规则操作类型,所述对所述流处理规则信息进行校验包括:
[0021]根据规则操作类型对所述源集群标识、所述源主题名称、所述目的集群标识、所述目的主题名称进行校验,其中,所述规则操作类型包括新增规则、修改规则和删除规则。
[0022]根据本公开的实施例,所述方法还包括:
[0023]在执行流式数据处理期间定时生成流处理报表。
[0024]根据本公开的实施例,定时监控流处理服务的运行状态和性能数据;以及
[0025]根据所述运行状态和所述性能数据生成流处理报表。
[0026]本公开的第二方面提供了一种Kafka数据自动化流处理装置,所述装置包括:
[0027]获取模块,用于接收用户输入的流处理规则信息;
[0028]校验模块,用于对所述流处理规则信息进行校验;以及
[0029]执行模块,用于在确定所述流处理规则信息校验通过后,根据所述流处理规则信息执行流式数据处理。
[0030]根据本公开的实施例,所述执行模块包括:解析子模块和流处理服务子模块。
[0031]解析子模块,用于启动新线程解析所述流处理规则信息;
[0032]流处理服务子模块,用于根据解析后的流处理规则信息对外提供流处理服务,所述流处理服务用于处理Kafka消息数据。
[0033]根据本公开的实施例,所述解析子模块包括第一确定单元。
[0034]第一确定单元,用于根据所述流处理规则信息确定源集群标识、源主题名称、目的集群标识、目的主题名称、规则类型、处理对象和规则具体内容。
[0035]根据本公开的实施例,流处理服务子模块包括:第二确定单元、第三确定单元、第四确定单元、第五确定单元和处理单元。
[0036]第二确定单元,用于根据源集群标识和源主题确定消息流入目标;
[0037]第三确定单元,用于根据目的集群标识和目的主题确定消息流出目标;
[0038]第四确定单元,用于根据规则类型确定调用的消息处理接口;
[0039]第五确定单元,用于对处理对象和规则具体内容进行解析后作为所述消息处理接口的接口传参;以及
[0040]处理单元,用于根据所述消息流入目标、所述消息流出目标和所述接口传参处理Kafka消息数据。
[0041]根据本公开的实施例,所述校验模块包括:校验子模块。
[0042]校验子模块,用于根据规则操作类型对所述源集群标识、所述源主题名称、所述目的集群标识、所述目的主题名称进行校验,其中,所述规则操作类型包括新增规则、修改规则和删除规则。
[0043]根据本公开的实施例,所述装置还包括:监控模块。
[0044]监控模块,用于在执行流式数据处理期间定时生成流处理报表。
[0045]根据本公开的实施例,所述监控模块包括监控子模块和报表生成子模块。
[0046]监控子模块,用于定时监控流处理服务的运行状态和性能数据;以及
[0047]报表生成子模块,用于根据所述运行状态和所述性能数据生成流处理报表。
[0048]本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于
存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述Kafka数据自动化流处理方法。
[0049]本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述Kafka数据自动化流处理方法。
[0050]本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述Kafka数据自动化流处理方法。
[0051]通过本公开的实施例提供的一种Kafka数据自动化流处理方法,通过接收用户输入的流处理规则信息,该信息是基于模板生成的,为保证流处理规则信息能够被顺利执行,对流处理规则信息进行校验,在校验通过后,根据流处理规则信息执行流式数据处理。通过将流处理规则服务化的方式实现kafka数据的自动化流处理,相较于相关技术中使用流处理组件Kafka Streams处理流式数据,本方法具备跨集群流处理能力,同时减少用户使用成本。
附图说明
[0052]通过以下参照附图对本公开实施例的描述,本公开的上述内容以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种Kafka数据自动化流处理方法,其特征在于,所述方法包括:接收用户输入的流处理规则信息;对所述流处理规则信息进行校验;以及在确定所述流处理规则信息校验通过后,根据所述流处理规则信息执行流式数据处理。2.根据权利要求1所述的方法,其特征在于,所述根据所述流处理规则信息执行流式数据处理包括:启动新线程解析所述流处理规则信息;根据解析后的流处理规则信息对外提供流处理服务,所述流处理服务用于处理Kafka消息数据。3.根据权利要求2所述的方法,其特征在于,所述启动新线程解析所述流处理规则信息包括:根据所述流处理规则信息确定源集群标识、源主题名称、目的集群标识、目的主题名称、规则类型、处理对象和规则具体内容。4.根据权利要求3所述的方法,其特征在于,所述根据解析后的流处理规则信息对外提供流处理服务包括:根据源集群标识和源主题确定消息流入目标;根据目的集群标识和目的主题确定消息流出目标;根据规则类型确定调用的消息处理接口;对处理对象和规则具体内容进行解析后作为所述消息处理接口的接口传参;以及根据所述消息流入目标、所述消息流出目标和所述接口传参处理Kafka消息数据。5.根据权利要求3所述的方法,其特征在于,所述流处理规则信息还包括规则操作类型,所述对所述流处理规则信息进行校验包括:根据规则操作类型对所述源集群标识、所述源主题名称、所述目的集群标识...

【专利技术属性】
技术研发人员:冯子杰钟小威杨旭杰蔡佳纯
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1