【技术实现步骤摘要】
本专利技术涉及数据库,具体地说是一种基于分布式数据库kaiwudb的分组窗口函数time_window实现方法。
技术介绍
1、分组窗口函数中的time_window(或称时间窗口函数)是流处理(streamprocessing)和时序数据库(time-series databases)中的核心概念,其技术背景涉及分布式系统、增量计算和实时分析三大
以下是关键技术实现的背景要点:
2、流式数据处理挑战:持续产生的数据流(如iot设备数据、日志、交易记录)无法一次性加载内存需要动态划分时间片段进行聚合计算(如每分钟交易量/每10秒温度均值)。传统批处理(如group by)无法满足实时性要求。
3、业务场景的实时化演进:在物联网的时序场景中,比如业务需求是每10分钟聚合温度传感器均值,传统方案无法动态处理设备断连/重连。时间窗口函数就可以会话窗口自适应分组。用户行为分析场景中统计用户每小时活跃时长时,传统方案缺陷用户行为跨整点时统计失真,而跳跃窗口精准对齐时间边界等等。
4、故如何在分布式数据库
...【技术保护点】
1.一种基于分布式数据库KaiwuDB的分组窗口函数time_window实现方法,其特征在于,该方法是在表数据分布的node1、node2及node3三个节点中按照时间列进行排序,将排序好的数据在网关节点进行堆排序,每排一行通过gRPC向上层orderedAggregator发送一行数据,orderedAggregator对输入的有序数据进行分组窗口函数计算;
2.根据权利要求1所述的基于分布式数据库KaiwuDB的分组窗口函数tim e_window实现方法,其特征在于,orderedAggregator对输入的有序数据进行分组窗口函数计算时,情况如下
3....
【技术特征摘要】
1.一种基于分布式数据库kaiwudb的分组窗口函数time_window实现方法,其特征在于,该方法是在表数据分布的node1、node2及node3三个节点中按照时间列进行排序,将排序好的数据在网关节点进行堆排序,每排一行通过grpc向上层orderedaggregator发送一行数据,orderedaggregator对输入的有序数据进行分组窗口函数计算;
2.根据权利要求1所述的基于分布式数据库kaiwudb的分组窗口函数tim e_window实现方法,其特征在于,orderedaggregator对输入的有序数据进行分组窗口函数计算时,情况如下:
3.根据权利要求2所述的基于分布式数据库kaiwudb的分组窗口函数tim e_window实现方法,其特征在于,orderedaggregator对输入的有序数据进行简化分组窗口函数计算具体如下:
4.根据权利要求3所述的基于分布式数据库kaiwudb的分组窗...
【专利技术属性】
技术研发人员:牟冠学,李明,张明丽,李冠彬,曹刘娟,
申请(专利权)人:山东浪潮数据库技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。