时长校正方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37276475 阅读:5 留言:0更新日期:2023-04-20 23:43
本发明专利技术公开了一种时长校正方法、装置、电子设备和存储介质,所述方法包括:读取状态数据集合和分片时长状态数据集合;所述状态数据集合用于记录司机状态变化信息;所述司机状态变化信息包括司机状态及其变化的时间节点;所述分片时长状态数据集合用于记录在设定的采样时间间隔内的司机状态;若状态数据集合中相邻的第二司机状态对应的时间节点早于第一司机状态对应的时间节点;将所述第二司机状态移动至相邻的第三司机状态和第四司机状态之间;更新所述分片时长状态数据集合中位于所述第二司机状态对应的时间节点和第四司机状态对应的时间节点之间的司机状态信息。本发明专利技术提供的技术方案,能在一定程度上能够减少分片时长校正所需要的算力成本。校正所需要的算力成本。校正所需要的算力成本。

【技术实现步骤摘要】
时长校正方法、装置、电子设备和存储介质


[0001]本专利技术涉及数据处理领域,具体涉及一种时长校正方法、装置、电子设备和存储介质。

技术介绍

[0002]在基于Flink实时计算司机分片时长的方法和系统中,因实时场景数据流转的复杂性可能会导致数据乱序、数据迟到问题,与之会带来丢失时长数据计算精度的问题。现有技术中,对于实时时长计算过程中出现数据迟到、延迟问题,主要采用基于离线数据来覆盖实时数据的策略来保证离线和实时数据的一致性。然而,这种计算方式需要对于离线的计算方式开发等同于实时计算的一套时长计算系统,需要消耗更多的计算成本。

技术实现思路

[0003]有鉴于此,本专利技术实施方式提供了一种时长校正方法、装置、电子设备和存储介质,在一定程度上能够减少分片时长校正所需要的算力成本。
[0004]本专利技术一方面提供了一种时长校正方法,所述方法包括:读取状态数据集合和分片时长状态数据集合;其中,所述状态数据集合用于记录司机状态变化信息;所述司机状态变化信息包括司机状态和司机状态发生变化的时间节点;所述分片时长状态数据集合用于记录在设定的采样时间间隔内的司机状态;针对所述状态数据集合中相邻的第一司机状态和第二司机状态,若所述第二司机状态对应的时间节点早于所述第一司机状态对应的时间节点;将所述第二司机状态移动至相邻的第三司机状态和第四司机状态之间;所述第二司机状态位于所述第一司机状态之后;所述第三司机状态对应的时间节点早于所述第二司机状态对应的时间节点;所述第四司机状态对应的时间节点晚于所述第二司机状态对应的时间节点;更新所述分片时长状态数据集合中位于所述第二司机状态对应的时间节点和第四司机状态对应的时间节点之间的司机状态信息。
[0005]在一个实施方式中,时长校正方法还包括:若所述第二司机状态对应的时间节点和所述第一司机状态对应的时间的时差大于预设时差,则将所述第二司机状态从所述状态数据集合中删除。
[0006]在一个实施方式中,更新所述分片时长状态数据集合中位于所述第二司机状态对应的时间节点和第四司机状态对应的时间节点之间的司机状态信息包括:若第二司机状态对应的时间节点属于采样时间节点,将所述第二司机状态对应的时间节点作为初始时间节点,按照设定的时间间隔依次生成司机动作信息;所述司机动作信息包括当前采样的时间节点和所述当前采样的时间节点对应的司机状态;若所述当前采样的时间节点早于所述第四司机状态对应的时间节点,将所述当前采样时段和当前采样的时间节点对应的司机状态更新至分片时长状态数据集合中。
[0007]在一个实施方式中,时长校正方法还包括:若所述当前采样的时间节点晚于所述第四司机状态对应的时间节点,将所述当前采样的时间节点的上一个时间节点至所述第四
司机状态对应的时间节点作为记录时段,并将所述记录时段和第二司机状态更新至分片时长状态数据集合中。
[0008]在一个实施方式中,时长校正方法还包括:若第二司机状态对应的时间节点不属于采样时间节点,在所述状态数据集合中读取位于所述第二司机状态对应的时间节点所在的时间间隔内的一个或多个目标时间节点;基于所述目标时间节点将所述采样时段划分为多个记录时段,并存储各个所述记录时段的状态信息,所述记录时段的状态信息用于表征记录时段内的司机状态和状态持续时长;相应的,若所述当前采样的时间节点早于所述第四司机状态对应的时间节点,将所述当前采样时段和当前采样的时间节点对应的司机状态更新至分片时长状态数据集合中。
[0009]在一个实施方式中,时长校正方法还包括:对比当前采样的时间节点对应的司机状态和所述分片时长状态数据集合中与所述当前采样的时间节点所在的采样时间间隔内对应的司机状态;若对比结果表征所述当前采样的时间节点对应的司机状态和所述分片时长状态数据集合中的司机状态相同,则停止生成司机动作信息。
[0010]在一个实施方式中,所述状态数据集合和分片时长状态数据集合存储在消息中间件中,时长校正方法还包括:从所述消息中间件中将所述状态数据集合和分片时长状态数据集合下载至Flink集群。
[0011]本专利技术另一方面还提供了一种时长校正装置,所述时长校正装置包括:数据读取单元,用于读取状态数据集合和分片时长状态数据集合;其中,所述状态数据集合用于记录司机状态变化信息;所述司机状态变化信息包括司机状态和司机状态发生变化的时间节点;所述分片时长状态数据集合用于记录在设定的采样时间间隔内的司机状态;状态调整单元,用于针对所述状态数据集合中相邻的第一司机状态和第二司机状态,若所述第二司机状态对应的时间节点早于所述第一司机状态对应的时间节点;将所述第二司机状态移动至相邻的第三司机状态和第四司机状态之间;所述第二司机状态位于所述第一司机状态之后;所述第三司机状态对应的时间节点早于所述第二司机状态对应的时间节点;所述第四司机状态对应的时间节点晚于所述第二司机状态对应的时间节点;分片时长状态数据集合更新单元,用于更新所述分片时长状态数据集合中位于所述第二司机状态对应的时间节点和第四司机状态对应的时间节点之间的司机状态信息。
[0012]本专利技术另一方面还提供了一种电子设备,所述电子设备装置包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述的时长校正方法。
[0013]本专利技术另一方面还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现上述的时长校正方法。
[0014]通过将由于实时计算场景中出现的乱序、迟到的司机状态数据按照时间节点的先后顺序调整至相应的位置,然后在将该司机状态数据对应的时间节点和该司机状态数据的下一条司机状态数据对应的时间节点之间的分片时长信息按照设定的采样时间间隔进行调整,并更新至分片时长状态数据集合中,从而减少分片时长校正所需要的算力成本。
附图说明
[0015]通过参考附图会更加清楚的理解本专利技术的特征和优点,附图是示意性的而不应理
解为对本专利技术进行任何限制,在附图中:
[0016]图1示出了本专利技术一个实施方式中时长校正方法的流程示意图;
[0017]图2示出了本专利技术一个实施方式中时长校正装置示意图;
[0018]图3示出了本专利技术一个实施方式中电子设备的结构示意图。
具体实施方式
[0019]为使本专利技术实施方式的目的、技术方案和优点更加清楚,下面将结合本专利技术实施方式中的附图,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。
[0020]在网约车/出租车的打车业务的营运过程中,需要掌握司机的在时间维度上的时长指标从而更好的推进相关业务的发展。例如,需要统计所有的司机在早高峰期间的累计出车时长。然而,由于实时场景数据流转的复杂性可能会导致获取司机状态数据时出现乱序、数据迟到等问本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种时长校正方法,其特征在于,所述方法包括:读取状态数据集合和分片时长状态数据集合;其中,所述状态数据集合用于记录司机状态变化信息;所述司机状态变化信息包括司机状态和司机状态发生变化的时间节点;所述分片时长状态数据集合用于记录在设定的采样时间间隔内的司机状态;针对所述状态数据集合中相邻的第一司机状态和第二司机状态,若所述第二司机状态对应的时间节点早于所述第一司机状态对应的时间节点;将所述第二司机状态移动至相邻的第三司机状态和第四司机状态之间;所述第二司机状态位于所述第一司机状态之后;所述第三司机状态对应的时间节点早于所述第二司机状态对应的时间节点;所述第四司机状态对应的时间节点晚于所述第二司机状态对应的时间节点;更新所述分片时长状态数据集合中位于所述第二司机状态对应的时间节点和第四司机状态对应的时间节点之间的司机状态信息。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述第二司机状态对应的时间节点和所述第一司机状态对应的时间的时差大于预设时差,则将所述第二司机状态从所述状态数据集合中删除。3.根据权利要求1所述的方法,其特征在于,更新所述分片时长状态数据集合中位于所述第二司机状态对应的时间节点和第四司机状态对应的时间节点之间的司机状态信息包括:若第二司机状态对应的时间节点属于采样时间节点,将所述第二司机状态对应的时间节点作为初始时间节点,按照设定的时间间隔依次生成司机动作信息;所述司机动作信息包括当前采样的时间节点和所述当前采样的时间节点对应的司机状态;若所述当前采样的时间节点早于所述第四司机状态对应的时间节点,将所述当前采样时段和当前采样的时间节点对应的司机状态更新至分片时长状态数据集合中。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:若所述当前采样的时间节点晚于所述第四司机状态对应的时间节点,将所述当前采样的时间节点的上一个时间节点至所述第四司机状态对应的时间节点作为记录时段,并将所述记录时段和第二司机状态更新至分片时长状态数据集合中。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:若第二司机状态对应的时间节点不属于采样时间节点,在所述状态数据集合中读取位于所述第二司机状态对应的时间节点所在的时间间隔内的一个或多个目标时间节点;基于所述目标时间节点将所述采样时段划分为多个记录时段...

【专利技术属性】
技术研发人员:于志杰
申请(专利权)人:北京白龙马云行科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1