用于处理用户出行数据的方法、装置和计算设备制造方法及图纸

技术编号:21631988 阅读:21 留言:0更新日期:2019-07-17 12:07
本说明书的实施例提供了用于处理用户出行数据的方法、装置和计算设备。该方法包括:获取表示用户出行路径的k个位置以及k个位置分别对应的停留概率;基于k个位置,确定m个OD结果,其中,m个OD结果中的每个OD结果包括k个位置中的至少两个位置;基于每个OD结果包括的至少两个位置分别对应的停留概率,确定每个OD结果对应的概率。

Methods, devices and computing devices for processing user travel data

【技术实现步骤摘要】
用于处理用户出行数据的方法、装置和计算设备
本说明书的实施例涉及数据处理领域,并且更具体地,涉及用于处理用户出行数据的方法、装置和计算设备。
技术介绍
为了合理地评价和规划城市交通(例如公交线网),需要对人群的出行数据进行分析。出行数据分析主要目的是准确地分析人群的出行需求,比如,出发地-到达地(Origination-Destination,OD)。然而,每个人的每天出行路径上可能存在很多活动的位置,其中可能只有部分位置是真正要去的地方,而其它位置仅是路途中的中间位置。那么,如何基于这些出行数据得到OD成为需要解决的问题之一。
技术实现思路
考虑到现有技术的上述问题,本说明书的实施例提供了用于处理用户出行数据的方法、装置和计算设备。一方面,本说明书的实施例提供了一种用于处理用户出行数据的方法,包括:获取表示用户出行路径的k个位置以及所述k个位置分别对应的停留概率,其中,k为大于1的正整数;基于所述k个位置,确定m个出发地-到达地OD结果,其中,所述m个OD结果中的每个OD结果包括所述k个位置中的至少两个位置,m为正整数;基于所述每个OD结果包括的至少两个位置分别对应的停留概率,确定所述每个OD结果对应的概率。另一方面,本说明书的实施例提供了一种用于处理用户出行数据的装置,包括:获取单元,用于获取表示用户出行路径的k个位置以及所述k个位置分别对应的停留概率,其中,k为大于1的正整数;第一确定单元,用于基于所述k个位置,确定m个出发地-到达地OD结果,其中,所述m个OD结果中的每个OD结果包括所述k个位置中的至少两个位置,m为正整数;第二确定单元,用于基于所述每个OD结果包括的至少两个位置分别对应的停留概率,确定所述每个OD结果对应的概率。另一方面,本说明书的实施例提供了一种计算设备,包括:至少一个处理器;与所述至少一个处理器进行通信的存储器,其上存储有可执行指令,所述可执行指令在被所述至少一个处理器执行时使得所述至少一个处理器实现上述方法。可见,在该技术方案中,不同的OD结果考虑了不同的位置组合,而且通过基于各个OD结果中包括的各个位置的停留概率来得到各个OD结果对应的概率,使得各个位置的概率得到了最大限度的尊重,这样能够利用最终的OD结果和相应的概率准确且合理地进行后续的交通评价和规划。附图说明通过结合附图对本说明书的实施例的更详细的描述,本说明书的实施例的上述以及其它目的、特征和优势将变得更加明显,其中,在本说明书的实施例中,相同的附图标记通常代表相同的元素。图1是根据一个实施例的用于处理用户出行数据的方法的示意性流程图。图2A是根据一个实施例的应用场景的例子的示意图。图2B是根据一个实施例的应用场景的例子的示意图。图3是根据一个实施例的用于处理用户出行数据的装置的示意框图。图4是根据一个实施例的用于处理用户出行数据的计算设备的硬件结构图。具体实施方式现在将参考各实施例讨论本文描述的主题。应当理解的是,讨论这些实施例仅是为了使得本领域技术人员能够更好地理解并且实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离权利要求书的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个实施例可以根据需要,省略、替换或者添加各种过程或组件。为了合理地评价和规划城市交通,通常需要分析人群的出行数据。例如,在评价和规划公交线网时,往往需要准确地分析人群的OD结果。然而,每人每天的出行路径上的活动位置可能很多,但其中可能只有部分位置是真正要去的地方,其它位置可能仅是路途中的中间位置。为此,可以引入概率模型来评估每个位置是O或D的概率。在本文中,可以将该概率称为每个位置对应的停留概率。例如,可以采用专家规则、有监督模型或半监督模型等各种方式来评估每个位置对应的停留概率。在本文的技术方案中,可以首先获取表示用户出行路径的k个位置以及这k个位置分别对应的停留概率。k可以是大于1的正整数。基于k个位置,可以确定m个OD结果,其中,每个OD结果可以包括k个位置中的至少两个位置,m为正整数。然后,可以基于每个OD结果包括的至少两个位置分别对应的停留概率,确定每个OD结果的概率。可见,在该技术方案中,可以通过将用户出行路径上的至少两个位置进行组合得到相应的OD结果,并且基于每个OD结果所包括的至少两个位置的停留概率来得到该OD结果的概率,由此可以将不同位置的停留概率考虑在内,这样能够利用最终的OD结果以及相应的概率来准确并且合理地进行后续的交通评价和规划。下面将结合具体实施例来描述上述技术方案。图1是根据一个实施例的用于处理用户出行数据的方法的示意性流程图。如图1所示,在步骤102中,可以获取表示用户出行路径的k个位置以及k个位置分别对应的停留概率,k为大于1的正整数。例如,用户出行路径可以通过多个位置的连线来表示。比如,用户出行路径至少可以包括两个位置,即出发地位置和到达地为止。此外,出行路径可能还包括至少一个中间位置。可以通过现有的任何适用的概率模型,计算各个位置的停留概率。在步骤104中,可以基于k个位置,确定m个OD结果。每个OD结果可以包括k个位置中的至少两个位置,m为正整数。例如,可以通过将k个位置中的至少两个位置进行组合,形成一个OD结果。这样,不同的位置组合可以形成不同的OD结果。在步骤106中,可以基于每个OD结果包括的至少两个位置分别对应的停留概率,确定每个OD结果对应的概率。例如,可以利用现有的概率计算方法,基于每个OD结果中的各个位置的停留概率,来确定这些位置的组合(即OD结果)对应的概率。可见,在该技术方案中,不同的OD结果考虑了不同的位置组合,而且通过基于各个OD结果中包括的各个位置的停留概率来得到各个OD结果对应的概率,使得各个位置的概率得到了最大限度的尊重,这样能够利用最终的OD结果和相应的概率准确且合理地进行后续的交通评价和规划。在一种方案中,可以引入固定的概率阈值。如果某个位置对应的停留概率小于或等于该概率阈值,则可以认为该位置是路途中的中间位置,则可以去除。而停留概率大于该概率阈值的位置可以连接起来形成OD结果。这种方式实现比较简单,但是由于采用的是“一刀切”的方式,可能并没有合理地考虑各个位置。在一个实施例中,可以通过枚举的方式得到k个位置的m个组合,从而形成m个OD结果。此处,可以理解的是,通常出行路径的出发地位置和到达地位置(即出行路径的两个端点的位置)都具有相对大的停留概率,比如该停留概率可以是1。那么,如果除了两个端点的位置以外,k个位置还包括中间位置,那么k个位置的各个组合主要是中间位置的各个组合。此时,m可以等于2k-2。也就是说,可以存在2k-2个组合作为OD结果。由此可知,m个组合中的每个组合至少包括作为出行路径的两个端点的位置。也就是说,每个OD结果至少包括作为出行路径的两个端点的位置。例如,图2A是根据一个实施例的应用场景的例子的示意图。应当理解的是,图2A仅是为了帮助本领域技术人员更好地理解本说明书的技术方案,而非限制其范围。如图2A所示,假设用户出行路径上包括A、B和C三个位置,其中,位置A和位置C可以是该出行路径的两个端点,位置B可以是中间位置。那么,可以形成两个组合,即两个OD结果。第一OD结果可以包括位置A本文档来自技高网...

【技术保护点】
1.一种用于处理用户出行数据的方法,包括:获取表示用户出行路径的k个位置以及所述k个位置分别对应的停留概率,其中,k为大于1的正整数;基于所述k个位置,确定m个出发地‑到达地OD结果,其中,所述m个OD结果中的每个OD结果包括所述k个位置中的至少两个位置,m为正整数;基于所述每个OD结果包括的至少两个位置分别对应的停留概率,确定所述每个OD结果对应的概率。

【技术特征摘要】
1.一种用于处理用户出行数据的方法,包括:获取表示用户出行路径的k个位置以及所述k个位置分别对应的停留概率,其中,k为大于1的正整数;基于所述k个位置,确定m个出发地-到达地OD结果,其中,所述m个OD结果中的每个OD结果包括所述k个位置中的至少两个位置,m为正整数;基于所述每个OD结果包括的至少两个位置分别对应的停留概率,确定所述每个OD结果对应的概率。2.根据权利要求1所述的方法,其中,所述基于所述k个位置,确定m个OD结果,包括:将所述k个位置进行组合,以形成m个组合作为所述m个OD结果,其中,所述m个组合中的每个组合至少包括所述k个位置中的作为所述用户出行路径的两个端点的位置,m等于2k-2。3.根据权利要求2所述的方法,其中,k小于或等于第一数量阈值。4.根据权利要求1所述的方法,其中,所述基于所述k个位置,确定m个OD结果,包括:确定所述k个位置中的n个位置,其中,所述n个位置对应的停留概率大于第一概率阈值,n为大于1的正整数;分别以所述n个位置作为端点,将所述用户出行路径划分为n-1个分段;分别针对所述n-1个分段中的每个分段,确定相应的OD结果,以得到所述m个OD结果。5.根据权利要求4所述的方法,其中,k大于第一数量阈值。6.根据权利要求4或5所述的方法,其中,所述分别针对所述n-1个分段中的每个分段,确定相应的OD结果,包括:针对所述n-1个分段中的第一分段,所述第一分段是所述n-1个分段中的任一分段:如果所述第一分段包括p个位置并且p-2小于或等于第二数量阈值,则将所述p个位置进行组合,以形成q个组合作为与所述第一分段对应的OD结果,其中,所述q个组合中的每个组合至少包括所述p个位置中的作为所述第一分段的两个端点的位置,其中,p为大于1的正整数,q为正整数;如果p-2大于所述第二数量阈值,则从所述p个位置中选择x个位置,并且将所述x个位置进行组合,以形成y个组合作为与所述第一分段对应的OD结果,其中,所述x个位置至少包括所述p个位置中的作为所述第一分段的两个端点的位置,所述y个组合中的每个组合至少包括所述p个位置中的作为所述第一分段的两个端点的位置,x为大于1的正整数,y为正整数。7.根据权利要求6所述的方法,其中,所述x个位置还包括第一组位置,所述第一组位置是所述第一分段的中间位置,并且所述第一组位置对应的停留概率大于第二概率阈值。8.根据权利要求6所述的方法,其中,所述x个位置还包括第二组位置,所述第二组位置是所述第一分段的中间位置,并且所述第二组位置是所述第一分段的中间位置中停留概率最大的前z个位置,z为正整数。9.一种用于处理用户出行数据的装置,包括:获取单元,用于获取表示用户出行路径的k个位置以及所述k个位置分别对应的停留概率,其中,k为大于1的正整数;第一确定单元,用于基于所...

【专利技术属性】
技术研发人员:赵星
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1