一种城市交通知识图谱的构建方法技术

技术编号:38989785 阅读:10 留言:0更新日期:2023-10-07 10:20
一种城市交通知识图谱的构建方法,包括:首先采用斯坦福大学发布的七步法,利用本体构建工具构建城市交通本体,形成知识图谱模式层;然后获取并融合城市交通多源数据,抽取出实体、属性和实体间的关系,构建知识图谱数据层;将知识图谱模式层和知识图谱数据层结合,生成城市交通知识图谱,并存储到数据库中;利用现有数据推理出城市交通的新知识,补入城市交通知识图谱。本发明专利技术用于解决交通数据开放共享程度不高的现状,融合多源数据,搭建城市交通知识体系,还可以应用于对交通状态进行预测,合理安排出行时间;查询最短距离路径、区域路况历史规律、交通需求量高发规律等信息,增强交通管理能力。强交通管理能力。强交通管理能力。

【技术实现步骤摘要】
一种城市交通知识图谱的构建方法


[0001]本专利技术涉及知识图谱构建
,特别涉及一种城市交通知识图谱构建方法。

技术介绍

[0002]随着智能系统应用的发展,知识图谱在越来越多的应用场景中发挥着重要作用,为各种智能任务提供多样化的知识服务。城市交通知识图谱是一种同时包含时间和空间信息的知识图谱。与普通静态知识图相比,时序知识图所包含的知识会随着时间和空间的变化而变化。城市交通知识图谱可以为后续任务提供具有时空信息的知识。然而目前,交通数据开放共享程度不高,数据条块化、垂直分割、信息碎片化,交通业务横向融合不足,尚未形成统一完备的城市交通知识体系。

技术实现思路

[0003]为了克服现有技术存在的不足,本专利技术提出一种融合多源数据,并推理出新知识的城市交通知识图谱的构建方法。
[0004]一种城市交通知识图谱的构建方法,包括以下步骤:
[0005]采用斯坦福大学发布的七步法,利用本体构建工具构建城市交通本体,形成知识图谱模式层;
[0006]获取并融合城市交通多源数据,抽取出实体、属性和实体间的关系,构建知识图谱数据层;
[0007]将知识图谱模式层和知识图谱数据层结合,生成城市交通知识图谱,并存储到数据库中;
[0008]利用现有数据推理出城市交通的新知识,补入城市交通知识图谱。
[0009]进一步,步骤1具体包括:
[0010]1.1七步法构建城市交通本体;
[0011]第一步确定本体的领域,明确领域本体的目的,本专利技术的本体涉及城市交通领域。
[0012]第二步考虑使用已有本体,确认相关本体是否已构建,避免重复使用,占用资源。
[0013]第三步列举本体中的关键项及其属性和描述,确定本体在领域中的一些重要概念。
[0014]第四步定义类和类的结构,采用自顶向下的方式逐级定义本体的分类及类之间的关系。
[0015]第五步定义类的属性,进一步描述各级分类的目的以及类间关系,包括上下级分类间的继承关系,上级分类相较下级,其定义更宽泛,因此其所具有的属性必然也为下级分类所具有。
[0016]第六步定义属性的约束,例如属性值的数据类型、数值范围等方面的限制。
[0017]第七步根据本体创建实例,创建过程为:选择分类,创建实例、填充属性值。
[0018]1.2知识图谱模式层;
[0019]将步骤1.1所构建的城市交通本体导入图数据库,并进一步补充完善实例,形成知识图谱模式层。
[0020]进一步,步骤2具体包括:
[0021]2.1获取数据;
[0022]本专利技术主要涉及城市道路交通,因此需要获取的城市交通数据主要包括路网结构和交通态势数据,以及预先获取的出租车GPS定位数据。以目标道路为杭州市上塘路及其周边区域为例,从地图数据库中获取杭州市上塘路及其周边区域的道路数据,例如可从开源地图数据库上下载目标区域的道路数据,该网站支持多种数据格式的导出方案,并可以自定义下载的区域范围,是一种适用的道路网络数据下载网站。利用OSM2GMNS从下载的目标道路网络中输出符合GMNS标准的道路网络数据,GMNS全称General Modeling Network Specification,其定义了一套灵活统一的多模式交通网络表示格式,OSM2GMNS还提供了简化交叉口功能,输出文件包括道路节点(node.csv)和道路连接弧(link.csv)。
[0023]目标道路兴趣点POI(Point of Interest)的获取可通过地图API的搜索POI接口获取,POI数据一般包含名称、类型、地址及经纬度等多种属性。
[0024]目标道路交通态势数据可通过高德地图API的交通态势接口获取,路况信息每两分钟更新一次,包含道路名称、方向、车行角度、路况、速度等信息。
[0025]出租车GPS定位数据为独立获取,包含杭州市出租车2017年4、5、6三个月的GPS定位数据,根据数据自身质量,删减掉因各种原因造成的异常数据待用,如定位点不在机动车合理区域的非真数据、长时间停留同一位置疑似非运营状态的无效数据等。
[0026]2.2数据预处理;
[0027]确定数据采样间隔,由于步骤2.1中所获取的交通态势数据时间间隔为两分钟,且不同数据的更新周期不完全相同,另外综合考虑网络连接的稳定性和数据分析所消耗的时间,将数据采样间隔确定为六分钟。
[0028]数据匹配和筛选,根据道路名称与道路网络连接弧数据相匹配,筛选出有交通态势数据的道路网络数据(包括道路网络节点和道路网络连接弧),剔除无效及冗余数据,从而改善数据质量。针对出租车GPS定位数据,根据区域筛选出与其他数据匹配的部分,然后根据载客状态分析得出出租车订单数据,所得数据包括订单出发地、订单目的地、时间等,分作两组,并与路网数据进行匹配,将所得GPS点进一步定位到路段。
[0029]进一步,步骤3具体包括:
[0030]将步骤2所得数据与步骤1.1所构建的知识图谱模式层结合,并针对动态数据部分设定好采样更新程序,对所有具有时序性的本体及其属性进行同步更新,初步生成城市交通知识图谱的完整结构。
[0031]进一步,步骤4具体包括:
[0032]根据步骤2.2预处理过后的出租车订单数据,进一步采用OPTICS聚类算法得出交通需求量的时空分布,作为城市交通知识图谱的新知识补充,其具体过程为:
[0033]将出租车订单数据分为“出发地”和“目的地”两组,再按时间进行切片处理,时间步设定为整体方案采样间隔的两倍及12分钟,对不同日期的相同时间作叠加处理,以计算历史平均值。对每组数据分别采用OPTICS聚类算法得出各时间片内的交通需求量空间分布情况。OPTICS算法是一种基于密度的聚类算法,其核心思想为:定义一类核心点,核心点具
有邻域内有MinPts个点这一特征,且邻域内的其他点若同时也是符合定义的核心点,则两者密度可达,通过一系列的密度可达最终将密集点聚拢成类。该算法的优势在于可以聚类非圆形区域,城市街道为条状网格结构,交通需求往往发生在道路两侧,这样的聚类算法更适合这一应用场景。所用算法流程如下:
[0034]输入:样本集X={x1,x2,

,x
m
},邻域参数(ε=inf,MinPts)
[0035]1初始化核心对象集合Ω
[0036]2遍历X的元素,如果是核心对象,则将其加入到核心对象集合Ω中
[0037]3如果核心对象集合Ω中元素都已经被处理,则算法结束,否则转入步骤4.
[0038]4在核心对象集合Ω中,随机选择一个未处理的核心对象o,首先将o标记为已处理,同时将o压入到有序列表p中,最后将o的ε

邻域中未访问的点,根据可达距离的大小(计算未访问的邻居点到o点的可达距离)依次存放到种子集合seeds中。
[0039]5如果种子集合seeds非空,跳转到3,否则,从种子集本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种城市交通知识图谱的构建方法,其特征在于,包括如下步骤:步骤1,采用斯坦福大学发布的七步法,利用本体构建工具构建城市交通本体,形成知识图谱模式层;步骤2,获取并融合城市交通多源数据,抽取出实体、属性和实体间的关系,构建知识图谱数据层;步骤3,将知识图谱模式层和知识图谱数据层结合,生成城市交通知识图谱,并存储到数据库中;步骤4,利用现有数据推理出城市交通的新知识,补入城市交通知识图谱。2.如权利要求1所述的城市交通知识图谱的构建方法,其特征在于:步骤1具体包括:1.1七步法构建城市交通本体;第一步确定本体的领域,明确领域本体的目的,本发明的本体涉及城市交通领域;第二步考虑使用已有本体,确认相关本体是否已构建,避免重复使用,占用资源;第三步列举本体中的关键项及其属性和描述,确定本体在领域中的一些重要概念;第四步定义类和类的结构,采用自顶向下的方式逐级定义本体的分类及类之间的关系;第五步定义类的属性,进一步描述各级分类的目的以及类间关系,包括上下级分类间的继承关系,上级分类相较下级,其定义更宽泛,因此其所具有的属性必然也为下级分类所具有;第六步定义属性的约束,例如属性值的数据类型、数值范围等方面的限制;第七步根据本体创建实例,创建过程为:选择分类,创建实例、填充属性值;1.2知识图谱模式层;将步骤1.1所构建的城市交通本体导入图数据库,并进一步补充完善实例,形成知识图谱模式层。3.如权利要求1所述的城市交通知识图谱的构建方法,其特征在于:步骤2具体包括:2.1获取数据;获取的城市交通数据主要包括路网结构和交通态势数据,以及预先获取的出租车GPS定位数据;2.2数据预处理;确定数据采样间隔,步骤2.1中所获取的交通态势数据有时间间隔,且不同数据的更新周期不完全相同,另外综合考虑网络连接的稳定性和数据分析所消耗的时间;数据匹配和筛选,根据道路名称与道路网络连接弧数据相匹配,筛选出有交通态势数据的道路网络数据(包括道路网络节点和道路网络连接弧),剔除无效及冗余数据,从而改善数据质量;针对出租车GPS定位数据,根据区域筛选出与其他数据匹配的部分,然后根据载客状态分析得出出租车订单数据,所得数据包括订单出发地、订单目的地、时间等,分作两组,并与路网数据进行匹配,将所得GPS点进一步定位到路段。4.如权利要求1所述的城市交通知识图谱的构建方法,其特征在于:步骤3具体包括:将步骤2所得数据与步骤1...

【专利技术属性】
技术研发人员:郭海锋周子盛许宏伟
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1