一种Kafka数据处理的方法和服务器技术

技术编号：26504344 阅读：14 留言：0更新日期：2020-11-27 15:31

本说明书提供一种Kafka数据处理的方法和服务器，该方法包括：获取待处理数据，以及所述待处理数据对应的第一消息偏移量Offset，将所述待处理数据、第一Offset加载到共享消息队列，当确定处理完所述共享消息队列中的数据后，将生成的第二Offset发送给ZooKeeper组件。通过该方法，可以实现先处理待处理数据，在向ZooKeeper提交Offset，避免因Consumer出现内存溢出或者所在服务器宕机导致向ZooKeeper提交的Offset与Consumer实际处理的数据不一致。

全部详细技术资料下载

【技术实现步骤摘要】
一种Kafka数据处理的方法和服务器
本公开涉及大数据领域，尤其涉及一种Kafka数据处理的方法和服务器。
技术介绍
近几年由于大数据时代的到来，互联网以及移动互联网业务的数据成倍的增长，大数据对于数据准确性需求也在逐步上升。传统的关系型数据库和数据传输方式渐渐无法满足用户对数据准确性的需求。Kafka架构设计原理：在Kafka的消费者(Consumer)中，有一个很关键的机制那就是消息偏移量(Offset)机制。在有了消息偏移量(Offset)机制后，即使Kafka在消费的过程中发生异常，或者引发再均衡重新分配分区的问题，在重新恢复消费时候也可以知道从哪个位置开始消费。在Kafka里面的消息偏移量(Offset)是用来记录消息在主题(topic)中消费进度的标志，消息偏移量(Offset)在分区中的是根据消息到达时间的顺序而递增的。在Consumer中，对于位置消息偏移量(Offset)的处理是在Consumer建立连接的时候，定时将现有用户的在每个分区的消息偏移量(Offset)记录到ZooKeeper组件中。所以每次consumer启动的时候都要先从ZooKeeper组件中读取记录的Offset作为本次消费的起始点。
技术实现思路
本说明书实施例提供了一种Kafka数据处理的方法和服务器，可以实现先处理待处理数据，在向ZooKeeper提交Offset，避免因Consumer出现内存溢出或者所在服务器宕机导致向ZooKeeper提交的Offset与Consumer实际...

【技术保护点】
1.一种Kafka数据处理的方法，其特征在于，所述方法包括：/n获取待处理数据，以及所述待处理数据对应的第一消息偏移量Offset；/n将所述待处理数据、第一Offset加载到共享消息队列；/n当确定处理完所述共享消息队列中的数据后，将生成的第二Offset发送给ZooKeeper组件。/n

【技术特征摘要】
1.一种Kafka数据处理的方法，其特征在于，所述方法包括：
获取待处理数据，以及所述待处理数据对应的第一消息偏移量Offset；
将所述待处理数据、第一Offset加载到共享消息队列；
当确定处理完所述共享消息队列中的数据后，将生成的第二Offset发送给ZooKeeper组件。

2.根据权利要求1所述的方法，其特征在于，所述获取待处理数据，具体包括：
通过Kafka组件获取所述待处理数据，并对所述待处理数据加载用于唯一标识所述待处理数据的ID标识。

3.根据权利要求1所述的方法，其特征在于，获取所述第一Offset的方法包括：
从ZooKeeper组件中获取与所述待处理数据对应的第一Offset，并将所述第一Offset作为起始Offset。

4.根据权利要求1所述的方法，其特征在于，所述将所述待处理数据、第一Offset加载到共享消息队列，具体包括：
根据所述待处理数据、第一Offset构造消息数据，将所述消息数据加载在共享消息队列中。

5.根据权利要求1所述的方法，其特征在于，所述当确定处理完所述共享消息队列中的数据后，将生成的第二Offset发送给ZooKeeper组件，具体包括：
将所述共享消息队列中的第一Offset删除，并生成第二Offset；
将所述第二Offset发送给ZooKeeper组...

【专利技术属性】
技术研发人员：王鑫，
申请(专利权)人：新华三大数据技术有限公司，
类型：发明
国别省市：河南;41

全部详细技术资料下载我是这个专利的主人