通勤偏好分析方法、挖掘方法、装置、设备和介质制造方法及图纸

技术编号:31078683 阅读:18 留言:0更新日期:2021-12-01 11:34
本申请实施例公开了一种通勤偏好分析方法、挖掘方法、装置、设备和介质,涉及大数据技术。其中,该通勤偏好分析方法包括:按照通勤方式,确定样本用户;确定样本用户的多类型出行特征;其中,多类型出行特征用于从不同的角度表征样本用户的通勤特点;依据样本用户的通勤方式和样本用户的多类型出行特征,确定通勤方式与多类型出行特征之间的关联关系,关联关系用于挖掘待处理用户的通勤偏好。本申请实施例可以提高用户通勤偏好挖掘的准确性、可靠性,以及提高通勤挖掘方案的适用广度。以及提高通勤挖掘方案的适用广度。以及提高通勤挖掘方案的适用广度。

【技术实现步骤摘要】
通勤偏好分析方法、挖掘方法、装置、设备和介质


[0001]本申请实施例涉及计算机技术,具体涉及大数据技术,尤其涉及一种通勤偏好分析方法、挖掘方法、装置、设备和介质。

技术介绍

[0002]目前,关于确定居民通勤方式,主要采用的方式包括:基于一定区域范围内的调查问卷方式、基于信令大数据的方式以及基于抽样用户的GPS定位的方式等,这些方案由于数据量有限、数据覆盖的用户群体较为局限以及数据精度较低等因素,导致通勤方式的统计结果不准确。
[0003]并且,现有方案中基于定数数据确定用户的通勤方式,通常是根据连续的定位数据确定用户轨迹,结合用户出行时间,计算用户出行速度,进而根据出行速度这一特征,分析用户的通勤方式。该方案只适用于连续定位的场景,导致适用场景比较局限。

技术实现思路

[0004]本申请实施例公开一种通勤偏好分析方法、挖掘方法、装置、设备和介质,以提高用户通勤偏好挖掘的准确性、可靠性,以及提高通勤挖掘方案的适用广度。
[0005]第一方面,本申请实施例公开了一种通勤偏好分析方法,包括:
[0006]按照通勤方式,确定样本用户;
[0007]确定所述样本用户的多类型出行特征;其中,所述多类型出行特征用于从不同的角度表征所述样本用户的通勤特点;
[0008]依据所述样本用户的通勤方式和所述样本用户的多类型出行特征,确定所述通勤方式与所述多类型出行特征之间的关联关系,所述关联关系用于挖掘待处理用户的通勤偏好。
[0009]第二方面,本申请实施例还公开了一种通勤偏好挖掘方法,所述通勤偏好挖掘方法基于本申请实施例任一公开的通勤偏好分析方法中,确定的通勤方式与用户多类型出行特征之间的关联关系实现,所述通勤偏好挖掘方法包括:
[0010]确定待处理用户的多类型出行特征;其中,所述多类型出行特征用于从不同的角度表征所述待处理用户的通勤特点;
[0011]利用所述通勤方式与用户多类型出行特征之间的关联关系,以及所述待处理用户的多类型出行特征,预测所述待处理用户的通勤方式。
[0012]第三方面,本申请实施例还公开了一种通勤偏好分析装置,包括:
[0013]用户确定模块,用于按照通勤方式,确定样本用户;
[0014]特征确定模块,用于确定所述样本用户的多类型出行特征;其中,所述多类型出行特征用于从不同的角度表征所述样本用户的通勤特点;
[0015]关系确定模块,用于依据所述样本用户的通勤方式和所述样本用户的多类型出行特征,确定所述通勤方式与所述多类型出行特征之间的关联关系,所述关联关系用于挖掘
待处理用户的通勤偏好。
[0016]第四方面,本申请实施例还公开了一种通勤偏好挖掘装置,包括:
[0017]特征确定模块,用于确定待处理用户的多类型出行特征;其中,所述多类型出行特征用于从不同的角度表征所述待处理用户的通勤特点;
[0018]通勤预测模块,用于利用通勤方式与用户多类型出行特征之间的关联关系,以及所述待处理用户的多类型出行特征,预测所述待处理用户的通勤方式。
[0019]第五方面,本申请实施例还公开了一种电子设备,包括:
[0020]至少一个处理器;以及
[0021]与所述至少一个处理器通信连接的存储器;其中,
[0022]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例任一所述的通勤偏好分析方法,或者执行如本申请实施例任一所述的通勤偏好挖掘方法。
[0023]第六方面,本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例任一所述的通勤偏好分析方法,或者执行如本申请实施例任一所述的通勤偏好挖掘方法。
[0024]根据本申请实施例的技术方案,通过收集样本用户以及确定样本用户的多类型出行特征,得到每种通勤方式与用户多类型出行特征之间的关联关系,以用于挖掘待处理用户的通勤偏好,解决了现有通勤方式统计方案准确性较低、方案适用场景较局限的问题,提高了用户通勤偏好挖掘的准确性、可靠性,以及提高了通勤挖掘方案的适用广度。
[0025]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0026]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0027]图1是根据本申请实施例公开的一种通勤偏好分析方法的流程图;
[0028]图2是根据本申请实施例公开的另一种通勤偏好分析方法的流程图;
[0029]图3是根据本申请实施例公开的一种通勤偏好分析方法的架构示意图;
[0030]图4是根据本申请实施例公开的一种通勤偏好挖掘方法的流程图;
[0031]图5是根据本申请实施例公开的一种通勤偏好分析装置的结构示意图;
[0032]图6是根据本申请实施例公开的一种通勤偏好挖掘装置的结构示意图;
[0033]图7是根据本申请实施例公开的一种电子设备的框图。
具体实施方式
[0034]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0035]图1是根据本申请实施例公开的一种通勤偏好分析方法的流程图,本申请实施例可以适用于通勤方式分析或挖掘的场景中。本申请实施例公开的通勤偏好分析方法可以由
通勤偏好分析装置来执行,该装置可以采用软件和/或硬件实现,并可集成在任意的具有计算能力的电子设备上。
[0036]如图1所示,本申请实施例公开的通勤偏好分析方法可以包括:
[0037]S101、按照通勤方式,确定样本用户。
[0038]示例性的,本申请实施例可以通过挖掘互联网用户的定位类型数据(或者称为互联网出行数据),按照不同的通勤方式,自动化分类确定样本用户,例如现有通勤方式可以包括公共交通、驾车、骑行和步行中的至少一种,可以分别确定对应每种通勤方式的样本用户。其中,互联网定位类型数据或者互联网出行数据是指任意的能够用于区分用户通勤方式的数据,例如用户定位坐标、用户连接的无线网络信息、用户上传至导航服务器的驾车标注数据、用户导航数据、用户乘坐公共交通的记录数据,以及用户骑行记录数据等。公共交通包括公交和地铁,因此,通勤方式也可具体细化为包括公交、地铁、驾车、骑行和步行。
[0039]通过利用互联网定位类型数据或者互联网出行数据,确定不同通勤方式的样本用户,相比于按照地理区域抽样确定样本用户的情况,可以更好地覆盖不同区域的用户群体,样本数据量可以得到大幅度提升,为后续得到准确的通勤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种通勤偏好分析方法,其特征在于,包括:按照通勤方式,确定样本用户;确定所述样本用户的多类型出行特征;其中,所述多类型出行特征用于从不同的角度表征所述样本用户的通勤特点;依据所述样本用户的通勤方式和所述样本用户的多类型出行特征,确定所述通勤方式与所述多类型出行特征之间的关联关系,所述关联关系用于挖掘待处理用户的通勤偏好。2.根据权利要求1所述的方法,其特征在于,所述多类型出行特征至少包括定位特征和通勤途中公共交通分布特征;所述通勤途中公共交通分布特征包括以下至少之一:距离所述样本用户的居住地和工作地为预设距离的公共交通站点的分布数量,以及所述公共交通站点距离所述样本用户的居住地和工作地的最小距离。3.根据权利要求2所述的方法,其特征在于,所述定位特征包括以下至少之一:通勤距离、居住地定位坐标、工作地定位坐标、通勤途中在公共交通站点的预设范围内的定位数量,以及定位速度。4.根据权利要求2所述的方法,其特征在于,所述多类型出行特征还包括用户画像特征和终端行为特征。5.根据权利要求2所述的方法,其特征在于,确定所述样本用户的通勤途中公共交通分布特征,包括:根据所述样本用户的居住地定位坐标和工作地定位坐标,在地图中确定通勤区域;利用地图数据,确定所述通勤区域中的公共交通兴趣点;根据公共交通兴趣点信息,确定所述样本用户的通勤途中公共交通分布特征。6.根据权利要求4所述的方法,其特征在于,所述终端行为特征包括所述样本用户针对所述通勤方式的导航操作行为。7.根据权利要求1所述的方法,其特征在于,所述按照通勤方式,确定样本用户,包括:利用互联网出行数据,基于所述通勤方式的预设用户统计方式,确定采用该通勤方式的样本用户;其中,所述通勤方式包括以下至少一种:公共交通、驾车、骑行和步行。8.根据权利要求7所述的方法,其特征在于,确定采用公共交通出行方式的样本用户,包括:从所述互联网出行数据中,确定通勤时段内不同候选用户终端连接公共交通上无线网络的时间长度、连接所述无线网络的出行距离,以及连接的所述无线网络的信号强度;根据确定的所述时间长度、所述出行距离,以及所述信号强度,确定所述采用公共交通出行方式的样本用户。9.根据权利要求7所述的方法,其特征在于,确定采用驾车出行方式的样本用户,包括:从所述互联网出行数据中,获取通勤时段内不同候选用户上报的驾车标注数据和/或不同候选用户的地图导航操作行为;根据所述驾车标注数据和/或所述地图导航操作行为,确定所述采用驾车出行方式的样本用户。10.根据权利要求7所述的方法,其特征在于,确定采用骑行出行方式的样本用户,包
括:从所述互联网出行数据中,确定通勤时段内不同候选用户对共享单车的使用情况;根据所述共享单车的使用情况,确定所述采用骑行出行方式的样本用户。11.根据权利要求7所述的方法,其特征在于,确定采用步行出行方式的样本用户,包括:从所述互联网出行数据,获取不同候选用户的居住地定位坐标和工作地定位坐标,并计算居住地和工作地之间的距离;根据计算的距离与距离阈值的关系,确定所述采用步行出行方式的样本用户。12.一种通勤偏好...

【专利技术属性】
技术研发人员:闫浩强阚长城项雯怡江畅王建光
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1