一种实时流数据拼接方法和系统、电子设备、存储介质技术方案

技术编号:40357579 阅读:19 留言:0更新日期:2024-02-09 14:43
本发明专利技术提供一种实时流数据拼接方法和系统、电子设备、存储介质,该方法包括:从上游数据源中接入实时流数据;将实时流数据中提取拼接键和拼接填充字段;若拼接键在宽表中已记录,则根据该拼接键的实时流数据的拼接填充字段,按照拼接规则填充宽表的相应拼接结果字段;若拼接键在宽表中未记录,则在宽表中插入新数据,并根据该拼接键的实时流数据的拼接填充字段,按照拼接规则填充宽表的相应拼接结果字段;当实时流数据完成拼接后,输出拼接键对应的拼接结果;也即根据拼接键索引定位到宽表的记录行,引导各实时流数据直接更新宽表的拼接结果,避免了多流数据拼接中需要维护拼接前后大量数据状态等问题,支持大规模流数据拼接处理。

【技术实现步骤摘要】

本专利技术属于数据处理,更具体的说,尤其涉及一种实时流数据拼接方法和系统、电子设备、存储介质


技术介绍

1、随着大数据技术的发展,企业对数据处理时效性要求越来越高,越来越多的场景采用实时流处理方式来提高数据处理时效。由于上游系统业务交易等特点,完整的交易要素往往会记录不同的库表当中,因此获取的实时流数据通常也是分散在不同的数据流中,后续对该业务行为进行实时分析时,首先需要把这些分散的数据元素聚合拼接成完整的交易宽表,下游再基于该交易宽表进行加工和分析处理。由于实时流数据存在乱序、并发度高等特点,加之各数据源流速不一致等原因,无法保证数据时刻同步,因此要把多个数据流中的数据进行拼接是比较困难,而基于实时流作业进行直接拼接的方法,存在需要维护待拼接数据的前后状态,技术架构复杂,不利于多个大规模数据流的实时拼接。

2、当前对实时流数据的拼接方法,通常包括2类:一种基于实时流框架的状态管理机制,将待拼接的数据流通过一定的缓存,当所有拼接数据到齐的情况下,输出拼接结果;另一类是基于关系存储引擎,将某些待拼接数据放入到数据库hbase等kv存储引擎中,当本文档来自技高网...

【技术保护点】

1.一种实时流数据拼接方法,其特征在于,包括:

2.根据权利要求1所述的实时流数据拼接方法,其特征在于,在所述从上游数据源中接入实时流数据之前,还包括:

3.根据权利要求1所述的实时流数据拼接方法,其特征在于,所述按照拼接规则填充所述宽表的相应拼接结果字段,包括:

4.根据权利要求1所述的实时流数据拼接方法,其特征在于,所述当所述实时流数据完成拼接后,输出所述拼接键对应的拼接结果,包括:

5.根据权利要求4所述的实时流数据拼接方法,其特征在于,所述当所述实时流数据完成拼接后,输出所述拼接键对应的拼接结果,包括:

<p>6.一种实时流数...

【技术特征摘要】

1.一种实时流数据拼接方法,其特征在于,包括:

2.根据权利要求1所述的实时流数据拼接方法,其特征在于,在所述从上游数据源中接入实时流数据之前,还包括:

3.根据权利要求1所述的实时流数据拼接方法,其特征在于,所述按照拼接规则填充所述宽表的相应拼接结果字段,包括:

4.根据权利要求1所述的实时流数据拼接方法,其特征在于,所述当所述实时流数据完成拼接后,输出所述拼接键对应的拼接结果,包括:

5.根据权利要求4所述的实时流数据拼接方法,其特征在于,所述当所述实时流数据完成拼接后,输出所...

【专利技术属性】
技术研发人员:钟新斌李志伟李萌刘一阳
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1