数据处理方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:26065718 阅读:11 留言:0更新日期:2020-10-28 16:38
本发明专利技术实施例公开了一种数据处理方法、装置、电子设备和计算机可读存储介质,通过获取多个用户在预定区域的行为轨迹信息,并根据各所述用户的行为轨迹信息确定各所述用户的路线语句,将各所述用户的路线语句输入至语句向量确定模型中进行训练处理,以获取所述预定区域中的多个网格的特征向量,其中,所述预定区域包括预先划分的多个网格,所述用户的路线语句由所述用户的至少一个乘车行为的出发网格和目的网格的标识组成,由此,本实施例中的各网格的特征向量可以更好地体现各网格之间的潜在关系,进而在基于本实施例的特征向量时可以提高目标网格预测及任务执行对象选择的效率和准确率。

【技术实现步骤摘要】
数据处理方法、装置、电子设备和可读存储介质
本专利技术涉及互联网
,更具体地,涉及一种数据处理方法、装置、电子设备和可读存储介质。
技术介绍
在共享运输服务中,对用户乘车信息进行合理有效地处理,例如根据用户乘车信息挖掘与轨迹中地点信息存在潜在关系的其他物理地点信息等,可以帮助共享运输平台进行更优化和安全的运营,为用户提供更优质的服务。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据处理方法、装置、电子设备和可读存储介质,以使得各网格的特征向量可以更好地体现各网格之间的潜在关系,进而使得在基于本实施例的特征向量时,目标网格预测及任务执行对象选择的效率和准确率较高。第一方面,本专利技术实施例提供一种数据处理方法,所述方法包括:获取多个用户在预定区域的行为轨迹信息,所述用户的行为轨迹信息包括至少一个乘车行为的出发网格和目的网格,所述预定区域包括预先划分的多个网格;根据各所述用户的行为轨迹信息确定各所述用户的路线语句,所述用户的路线语句由所述用户的至少一个乘车行为的出发网格和目的网格的标识组成;将各所述用户的路线语句输入至语句向量确定模型中进行训练处理,以获取所述预定区域中的多个网格的特征向量。可选的,根据各所述用户的行为轨迹信息确定各所述用户的路线语句包括:将所述用户在预定时间内的行为轨迹信息中的各出发网格和各目的网格的标识组成的语句确定为所述用户的路线语句。可选的,根据各所述用户的行为轨迹信息确定各所述用户的路线语句包括:根据所述用户的连续乘车行为确定所述用户的路线语句;其中,所述用户的路线语句由所述连续乘车行为的出发网格和目的网格的标识组成。可选的,所述路线语句还包括预设的句首和句尾。可选的,所述语句向量确定模型为Word2Vec模型。可选的,所述预定区域的多个网格根据经度和纬度等距划分获得。可选的,所述预定区域的多个网格根据场所类别或地理信息划分获得,所述地理信息包括街道和/或路段。可选的,所述方法还包括:根据所述预定区域中的各网格的特征向量向目标用户推送目标网格。可选的,根据所述预定区域中的各网格的特征向量向用户推送目标网格包括:根据所述目标用户的当前输入信息确定网格候选集,所述目标用户的当前输入信息包括距离范围信息和/或目标地址的部分信息;获取所述目标用户所在网格的特征向量以及所述网格候选集中的各候选网格的特征向量;计算所述目标用户所在网格的特征向量分别与各所述候选网格的特征向量的相关度;根据所述相关度计算结果确定至少一个目标网格;推送所述至少一个目标网格。可选的,所述方法还包括:根据所述预定区域中的各网格的特征向量确定目标任务对应的任务执行对象。可选的,根据所述预定区域中的各网格的特征向量确定目标任务对应的任务执行对象包括:获取目标任务信息,所述目标任务信息包括出发网格和目的网格的标识;获取所述目标任务的出发网格的特征向量和目的网格的特征向量;根据所述目标任务的出发网格的特征向量、目的网格的特征向量以及目标任务附加信息确定所述目标任务的类型,所述目标任务附加信息包括目标任务发布时间、所述目标任务的出发网格和/或所述目的网格对应的历史任务的评价信息中的至少一项;根据所述目标任务的类型将所述目标任务分配给对应的任务执行对象。第二方面,本专利技术实施例提供一种数据处理装置,所述装置包括:轨迹信息获取单元,被配置为获取多个用户在预定区域的行为轨迹信息,所述用户的行为轨迹信息包括至少一个乘车行为的出发网格和目的网格,所述预定区域包括预先划分的多个网格;路线语句确定单元,被配置为根据各所述用户的行为轨迹信息确定各所述用户的路线语句,所述用户的路线语句由所述用户的至少一个乘车行为的出发网格和目的网格的标识组成;特征向量获取单元,被配置为将各所述用户的路线语句输入至语句向量确定模型中进行训练处理,以获取所述预定区域中的多个网格的特征向量。第三方面,本专利技术实施例提供一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如本专利技术实施例第一方面所述的方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时以实现如本专利技术实施例第一方面所述的方法。本专利技术实施例通过获取多个用户在预定区域的行为轨迹信息,并根据各所述用户的行为轨迹信息确定各所述用户的路线语句,将各所述用户的路线语句输入至语句向量确定模型中进行训练处理,以获取所述预定区域中的多个网格的特征向量,其中,所述预定区域包括预先划分的多个网格,所述用户的路线语句由所述用户的至少一个乘车行为的出发网格和目的网格的标识组成,由此,本实施例中的各网格的特征向量可以更好地体现各网格之间的潜在关系,进而在基于本实施例的特征向量时可以提高目标网格预测及任务执行对象选择的效率和准确率。附图说明通过以下参照附图对本专利技术实施例的描述,本专利技术的上述以及其它目的、特征和优点将更为清楚,在附图中:图1是相关技术的用户乘车轨迹示意图;图2是本专利技术实施例的数据处理方法的流程图;图3和图4是本专利技术实施例的区域网格的示意图;图5是本专利技术实施例的用户行为轨迹的示意图;图6是本专利技术实施例的网格推送方法的流程图;图7是本专利技术实施例的任务处理对象确定方法的流程图;图8是本专利技术实施例的数据处理方法的处理过程示意图;图9是本专利技术实施例的数据处理装置的示意图;图10是本专利技术实施例的电子设备的示意图。具体实施方式以下基于实施例对本专利技术进行描述,但是本专利技术并不仅仅限于这些实施例。在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本专利技术。为了避免混淆本专利技术的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。在对用户的乘车轨迹信息进行处理时,传统的方法是基于乘车记录的原始地图坐标处理,这样的方法灵活性低,效率不高。这些坐标信息也难以直接用于训练其他模型,所以把这些地理位置信息转化成特征向量信息显得非常必要。在相关技术中,采样图嵌入(GraphEmbedding),例如DeepWalk算法等,来获取地理坐标信息本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取多个用户在预定区域的行为轨迹信息,所述用户的行为轨迹信息包括至少一个乘车行为的出发网格和目的网格,所述预定区域包括预先划分的多个网格;/n根据各所述用户的行为轨迹信息确定各所述用户的路线语句,所述用户的路线语句由所述用户的至少一个乘车行为的出发网格和目的网格的标识组成;/n将各所述用户的路线语句输入至语句向量确定模型中进行训练处理,以获取所述预定区域中的多个网格的特征向量。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取多个用户在预定区域的行为轨迹信息,所述用户的行为轨迹信息包括至少一个乘车行为的出发网格和目的网格,所述预定区域包括预先划分的多个网格;
根据各所述用户的行为轨迹信息确定各所述用户的路线语句,所述用户的路线语句由所述用户的至少一个乘车行为的出发网格和目的网格的标识组成;
将各所述用户的路线语句输入至语句向量确定模型中进行训练处理,以获取所述预定区域中的多个网格的特征向量。


2.根据权利要求1所述的方法,其特征在于,根据各所述用户的行为轨迹信息确定各所述用户的路线语句包括:
将所述用户在预定时间内的行为轨迹信息中的各出发网格和各目的网格的标识组成的语句确定为所述用户的路线语句。


3.根据权利要求1所述的方法,其特征在于,根据各所述用户的行为轨迹信息确定各所述用户的路线语句包括:
根据所述用户的连续乘车行为确定所述用户的路线语句;
其中,所述用户的路线语句由所述连续乘车行为的出发网格和目的网格的标识组成。


4.根据权利要求1-3中任一项所述的方法,其特征在于,所述路线语句还包括预设的句首和句尾。


5.根据权利要求1所述的方法,其特征在于,所述语句向量确定模型为Word2Vec模型。


6.根据权利要求1所述的方法,其特征在于,所述预定区域的多个网格根据经度和纬度等距划分获得。


7.根据权利要求1所述的方法,其特征在于,所述预定区域的多个网格根据场所类别或地理信息划分获得,所述地理信息包括街道和/或路段。


8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述预定区域中的各网格的特征向量向目标用户推送目标网格。


9.根据权利要求8所述的方法,其特征在于,根据所述预定区域中的各网格的特征向量向用户推送目标网格包括:
根据所述目标用户的当前输入信息确定网格候选集,所述目标用户的当前输入信息包括距离范围信息和/或目标地址的部分信息;
获取所述目标用户所在网格的特征向量以...

【专利技术属性】
技术研发人员:林宇澄杨晓庆孙丽圆李奘叶杰平
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1