当前位置: 首页 > 专利查询>浙江大学专利>正文

一种居民出行信息预测方法技术

技术编号:35779545 阅读:22 留言:0更新日期:2022-12-01 14:24
本发明专利技术涉及一种居民出行信息预测方法,其主要步骤包括:收集用户个人信息及位置信息;根据位置信息对出行信息进行提取;构建基于BERT的时间序列模型对出行信息进行预测。以行程时空数据、用户个人信息、城市建成环境数据为模型输入,以出行方式及出行目的等出行信息为模型输出;根据出行调查进度与数据积累迭代训练及优化模型;优化完毕的模型即可用于居民出行信息的预测。本发明专利技术方法可更快更准地预测出行活动,可以为交通决策、交通规划和基础设施建设提供更加细致的信息,且能够预测交通方式分配以提高出行效率,为低碳减排和出行即服务平台的建设提供数据支撑。务平台的建设提供数据支撑。务平台的建设提供数据支撑。

【技术实现步骤摘要】
一种居民出行信息预测方法


[0001]本专利技术涉及出行信息数据采集方法与识别领域,尤其是基于智能手机定位大数据对居民出行过程和轨迹进行采集,利用基于BERT(Bidirectional Encoder Representation from Transformers)的时间序列方法识别和预测出行信息,形成用于交通规划和交通决策的数据基础。

技术介绍

[0002]我国经济的蓬勃发展在大幅提升居民生活水平的同时,也给城市交通组织和设施带来了日益增长的压力。交通拥堵已成为对城市发展和居民对美好生活的向往产生制约的关键问题之一,同时也为可持续发展和低碳环保带来了严峻挑战。为了获得一定区域内居民交通出行的基本特征,为交通基础设施建设提供信息支撑,居民出行调查是有力的方法,并以准确性和高效性为关键点。
[0003]许多城市规律性地开展大规模的居民出行调查,其核心内容是受访者使用出行链的方式记录出行起讫点、交通方式、出行目的等信息。为了提高调查结果可靠性,传统居民出行调查经历了纸笔调查、电话调查、电脑辅助自主填报等形式,然而这些方法更新速度慢,采样率低,并且无法避免主观认知造成的数据质量下降,无法提供具体路径选择信息。智能手机普及率的提高,使得采用高精度定位日志替代传统出行调查成为可能。其在出行链组成、区域内出行特征、道路交通实时运行状态等的精确记录,出行需求及路径选择分析等方面都具有独特的优势,并且相比手机信令数据展现出更佳的精确性和丰富性。而在智能手机调查的“无感化”和“被动化”方面,受访者手动记录频率降低的同时,如何同时保证并提高数据可靠性依然是研究的重点。
[0004]基于出行调查数据,离散选择模型结合实测交通流数据与阻抗函数等,能够对个人及社会属性、交通方式选择偏好、时空分布等进行拟合及分配。但局限于模型复杂度,其逐渐被机器学习及深度学习模型所取代,并常用于人群出行特征分析。城市化进程的加快以及共享出行等新兴出行方式的普及,出行即服务等体系的探索及发展,为居民出行信息分析带来了急剧增多的影响因素及严峻的挑战。就个体出行活动预测而言,亟需能够解析更为复杂的因子组合,并能进行高效精准预测的新型模型结构,以增强信息提取及利用的效率。

技术实现思路

[0005]针对上述
技术介绍
中存在的缺陷,本专利技术提供一种居民出行信息预测方法。本专利技术方法首先基于智能手机获取实时高精度定位日志数据,包括用户出行时间、地点、方式及目的等出行特征,结合基于注意力机制的数据处理方法,对居民出行链进行复现,实现高可靠性、自动化的出行信息采集。相较于抽样率有限、精度较差的传统居民出行调查,以及定位精确度有限的手机信令数据,定位日志依托于极高的智能手机普及率,能够详细反映个人及人群的出行特征,并覆盖全距离范围内、多种特征组合的出行。
[0006]将所收集的出行信息划分为时间序列数据,构建基于BERT的深度学习网络模型,对居民个人的出行方式、出行目的和出行时段进行整合预测。在充分利用经济社会属性、出行信息等多种因素组合的基础上,该模型具备出行活动链全过程预测,以及根据现有或预约出行链结构自动修正预测结果的能力,同时具有良好的拟合精度。
[0007]本专利技术采用以下技术方案实现:
[0008]一种居民出行信息预测方法,包括以下步骤:
[0009](1)采集用户个人信息:包括性别、年龄、职业、收入、居住区域、机动车驾照保有情况及交通工具使用情况;并赋予其唯一身份识别编号(ID),用于保护隐私及匹配所得数据;
[0010](2)获取用户的位置信息:对于某一用户ID,以每2秒的频率记录当前时间戳t
n
、水平位置精度H
n
、经度J
n
、纬度W
n
、速度V
n
、加速度A
n
、方向(与正北方向的顺时针夹角)D
n
以及方向改变速率D

n
,并以每20秒的频率上传出行记录至服务器,从而形成居民出行调查日志数据集。所述方向改变速率D

n
的计算公式为:其中,Δt
n
为两相邻定位点间的时间戳之差,ΔD
n
为两相邻定位点间的方向D
n
之差。
[0011](3)根据步骤(2)中用户的位置信息,获得候选停留点:基于注意力机制,从居民出行调查日志数据集中筛选出候选停留点。出现以下情况则将候选停留点合并为一个候选停留点:若两个候选停留点间距不足50米;若两个候选停留点的间距不大于150米,且时间差不大于5分钟。
[0012](4)基于步骤(2)得到的用户的位置信息和步骤(3)得到的候选停留点,获得用户的出行信息;所述出行信息包括出行方式、出行目的和出行时段。据此可对出行活动安排进行复现,即出行活动链。
[0013](5)当日进行的行程数据存储于本地及云端,用户可随时于应用程序内查看并核准行程信息及出行记录。
[0014](6)BERT是用于自然语言处理的一种预训练模型,基于此构建时间序列模型,具体是以全连接层替代输入层,以Sigmoid层替代输出层构建基于BERT的时间序列模型;所述模型以行程时空数据Trip
ts
(出行时段、出行时长、出行距离、平均速度、最大速度、速度的50/75分位数、平均加速度、最大加速度、加速度的50/75分位数、5km/h以下速度的时空占比、方向改变速率D

n
、用户个人信息Ind
at
(性别、年龄、职业、收入、居住区域、机动车驾照保有情况、交通工具使用情况)、城市建成环境数据Bud
en
(城市用地类型及道路分布)等特征为输入;以出行信息Trv
in
(出行方式、出行目的、出行时段)为输出。
[0015](7)根据前k个调查日获取的出行信息进行预训练,在此基础上将第k+1至k+n个调查日每日的数据输入模型,可对其实现迭代优化,该流程如图4所示。
[0016](8)模型部署于智能手机上后,于应用程序界面展示用户当前时段的出行信息识别及预测结果,并由用户进行匹配度评价,从而可对模型进行进一步优化;
[0017](9)采用优化后的模型对居民未来的出行信息进行预测。
[0018]上述技术方案中,进一步地,所述的步骤(3)中,基于注意力机制,从居民出行调查日志数据集中筛选出候选停留点,具体为:
[0019]首先,对获取的用户位置信息进行加密:
[0020]X
i
=[sinW
i
,cosW
i
][0021]其中,i=1,2...n,X
i
为时间戳t
i
时的加密位置信息,W
i
为时间戳t
i
时的纬度;
[0022]接着,计算加密后任意两个位置之间的组合值C
ij

[0023][00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种居民出行信息预测方法,其特征在于,包括以下步骤:1)采集用户个人信息:包括性别、年龄、职业、收入、居住区域、机动车驾照保有情况及交通工具使用情况,并赋予其唯一身份识别编号ID;2)采集用户的位置信息:对于某一用户ID,以每2秒的频率记录当前时间戳t
n
、水平位置精度H
n
、经度J
n
、纬度W
n
、速度V
n
、加速度A
n
、方向D
n
,并以固定频率上传用户位置信息,从而形成居民出行调查日志数据集;3)根据步骤(2)中用户的位置信息,获得候选停留点:基于注意力机制,从出行调查日志数据集筛选出候选停留点;出现以下情况则将候选停留点合并为一个候选停留点:若两个候选停留点间距不足50米;若两个候选停留点的间距不大于150米,且时间差不大于5分钟;4)基于步骤(3)得到的用户的位置信息和步骤(4)得到的候选停留点,获得用户的出行信息,所述出行信息包括出行方式、出行目的、出行时段;5)储存当日的出行信息,用户可随时查看并核准出行信息;6)以全连接层替代输入层,以Sigmoid层替代输出层,构建基于BERT的时间序列模型;所述模型以行程时空数据Trip
ts
、用户个人信息Ind
at
、城市建成环境数据Bud
en
为输入;以出行信息为输出;7)根据前k个调查日获取的出行信息进行预训练,通过第k+1至k+n个调查日每日的数据作为模型输入进行迭代优化;8)用户根据实际情况对当前时段的出行信息预测结果进行匹配度评价,从而对模型进行进一步优化;9)采用优化后的模型对居民未来的出行信息进行预测。2.根据权利要求1所述的居民出行信息预测方法,其特征在于,所述的步骤(3)中,基于注意力机制,从居民出行调查日志数据集中筛选出候选停留点,具体为:首先,对获取的用户位置信息进行加密:X
i
=[sinW
i
,cosW
i
]其...

【专利技术属性】
技术研发人员:孙轶琳董轶男陈逸洁蒋雨豪
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1