一种基于领域知识图谱的路局配置文件防错系统技术方案

技术编号:31018737 阅读:9 留言:0更新日期:2021-11-30 03:03
本发明专利技术公开了一种基于领域知识图谱的路局配置文件防错系统,该系统利用领域知识图谱的方法,构建铁路调度静态数据的知识图谱,在图数据库中查询并实现对错误内容的自动化检测以及文件数据校正,不仅提升工作效率,也可以保障路局配置文件的正确性。以保障路局配置文件的正确性。以保障路局配置文件的正确性。

【技术实现步骤摘要】
一种基于领域知识图谱的路局配置文件防错系统


[0001]本专利技术涉及铁道科学
,尤其涉及一种基于领域知识图谱的路局配置文件防错系统。

技术介绍

[0002]国铁集团各路局TDCS(Train Dispatching Command System,列车调度指挥系统)中心与部TDCS中心,各路局TDCS中心之间相互交换站场显示数据时会使用到一种cfg类型的路局配置文件。在与其他TDCS/CTC厂家交换邻局路局配置文件时存在数据量大、格式不符合部标规范,配置不符合部标规定的问题,给数据验证和系统维护工作带来了诸多困难。
[0003]目前主要采用两种方案进行路局配置文件的检查与修正:
[0004]方案一、部标协议中的路局配置文件存有大量运行图显示的关键数据,每一部分数据都有各自严格的内容定义和格式规范,数据内容有误或格式不规范都将导致运行图显示错误。在实际应用场景中,由于缺乏规范化方法,数据的检查修正工作极为繁琐,主要通过人工进行校验。
[0005]但是,方案一主要依靠人工来进行,存在漏检、出错率高、消耗时间、消耗人力的明显缺点。
[0006]方案二、路局配置文件自动规范化方法依靠计算机程序完成数据自检逻辑,特点是通过自定义的自检逻辑按照部标协议来检查路局配置文件各项数据的内容和格式,当检查到错误时,能够输出错误信息。自检逻辑在执行时检查包含行数据格式是否有效(格式检查)和读入数据是否合法(分段检查),和其他类数据一起进行关联比较确保数据的一致性和有效性(关联检查)。主要检查方法有检查车站配置站码是否重复,检查子图切换点线间距不能为0,检查底图车站站名与车站配置站名是否一致,检查底图车站站码与车站站码是否对应等。
[0007]但是,方案二中错误的纠正还需要人工去完成,同时当协议和数据规范变更时,建立的自检逻辑将不再适用,还需要开发人员对程序代码进行持续的维护。同时基于关系数据库的查询在面对关联复杂多层次的数据验证时,容易产生效率低下的问题。

技术实现思路

[0008]本专利技术的目的是提供一种基于领域知识图谱的路局配置文件防错系统,可以自动的对路局配置文件进行信息检查并自动纠错,从而提升了工作效率。
[0009]本专利技术的目的是通过以下技术方案实现的:
[0010]一种基于领域知识图谱的路局配置文件防错系统,包括:
[0011]数据获取单元,用于从数据源中获取构建铁路领域知识图谱的数据;
[0012]铁路领域知识图谱构建与存储单元,用于从数据获取单元获得相关数据,从中提取出与铁路相关的实体、实体相关信息以及不同实体之间的关系,将实体的相关信息作为实体的属性,利用实体之间的关系构建不同实体之间的连边,将实体关联起来,构成铁路领
域知识图谱并存储为图数据库;
[0013]信息查询与修正单元,从输入的路局配置文件中,识别出调度区段数据,提取出相应的调度台信息,在图数据库中查询相应的调度台台码、相应的调度台管理的车站及车站站码,将查询结果与路局配置文件中的信息进行比较,若不一致,则利用查询结果对路局配置文件进行修正;其中,所需要查询的具体的调度台、车站、区间与股道均为实体。
[0014]由上述本专利技术提供的技术方案可以看出,利用领域知识图谱的方法,构建铁路调度静态数据的知识图谱,在图数据库中查询并实现对错误内容的自动化检测以及文件数据校正,不仅提升工作效率,也可以保障路局配置文件的正确性。
附图说明
[0015]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
[0016]图1为本专利技术实施例提供的一种基于领域知识图谱的路局配置文件防错系统的示意图;
[0017]图2为本专利技术实施例提供的铁路领域主要概念和关系模式的示意图;
[0018]图3为本专利技术实施例提供的将铁路调度领域知识图谱中的实体和关系存储到Neo4j图数据库的示意图;
[0019]图4为本专利技术实施例提供的路局配置文件的纠错流程图。
具体实施方式
[0020]下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。
[0021]首先对本文中可能使用的术语进行如下说明:
[0022]术语“包括”、“包含”、“含有”、“具有”或其它类似语义的描述,应被解释为非排它性的包括。例如:包括某技术特征要素(如原料、组分、成分、载体、剂型、材料、尺寸、零件、部件、机构、装置、步骤、工序、方法、反应条件、加工条件、参数、算法、信号、数据、产品或制品等),应被解释为不仅包括明确列出的某技术特征要素,还可以包括未明确列出的本领域公知的其它技术特征要素。
[0023]术语“由
……
组成”表示排除任何未明确列出的技术特征要素。若将该术语用于权利要求中,则该术语将使权利要求成为封闭式,使其不包含除明确列出的技术特征要素以外的技术特征要素,但与其相关的常规杂质除外。如果该术语只是出现在权利要求的某子句中,那么其仅限定在该子句中明确列出的要素,其他子句中所记载的要素并不被排除在整体权利要求之外。
[0024]下面对本专利技术所提供的一种基于领域知识图谱的路局配置文件防错系统进行详细描述。本专利技术实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
本专利技术实施例中未注明具体条件者,按照本领域常规条件或制造商建议的条件进行。如图1所示,该系统主要包括:
[0025]数据获取单元,用于从数据源中获取构建铁路领域知识图谱的数据;
[0026]铁路领域知识图谱构建与存储单元,用于从数据获取单元获得相关数据,从中提取出与铁路相关的实体、实体相关信息以及不同实体之间的关系,将实体的相关信息作为实体的属性,利用实体之间的关系构建不同实体之间的连边,将实体关联起来,构成铁路领域知识图谱并存储为图数据库;
[0027]信息查询与修正单元,从输入的路局配置文件中,识别出调度区段数据,提取出相应的调度台信息,在图数据库中查询相应的调度台台码、相应的调度台管理的车站及车站站码,将查询结果与路局配置文件中的信息进行比较,若不一致,则利用查询结果对路局配置文件进行修正;其中,所需要查询的具体的调度台、车站、区间与股道均为实体,实体之间的关系包括:调度台与车站之间的管理关系,区间与相邻车站之间的连接关系,股道与车站的从属关系。
[0028]本专利技术实施例中,调度台、车站、股道、区间、车站站图都是概念类型,单独具体的调度台(例如,京沪调度台,京广调度台,京哈调度台)、车站(例如,北京南站,北京东站)、区间(例如,北京南
‑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于领域知识图谱的路局配置文件防错系统,其特征在于,包括:数据获取单元,用于从数据源中获取构建铁路领域知识图谱的数据;铁路领域知识图谱构建与存储单元,用于从数据获取单元获得相关数据,从中提取出与铁路相关的实体、实体相关信息以及不同实体之间的关系,将实体的相关信息作为实体的属性,利用实体之间的关系构建不同实体之间的连边,将实体关联起来,构成铁路领域知识图谱并存储为图数据库;信息查询与修正单元,从输入的路局配置文件中,识别出调度区段数据,提取出相应的调度台信息,在图数据库中查询相应的调度台台码、相应的调度台管理的车站及车站站码,将查询结果与路局配置文件中的信息进行比较,若不一致,则利用查询结果对路局配置文件进行修正;其中,所需要查询的具体的调度台、车站、区间与股道均为实体。2.根据权利要求1所述的一种基于领域知识图谱的路局配置文件防错系统,其特征在于,所述构建铁路领域知识图谱的数据包括:结构化数据、半结构化数据和纯文本数据;所述结构化数据包括:关系型数据库表示和存储的二维形式数据;半结构化数据包括:用相关标记用来分隔语义元素,不存在数据库形式的数据。3.根据权利要求1所述的一种基于领域知识图谱的路局配置文件防错系统,其特征在于,提取出与铁路相关的实体、实体相关信息以及不同实体之间的关系构成两类三元组的数据结构:第一类三元组包含了不同实体之间的关系,表示为:<实体1,关系,实体2>;所述实体1与实体2表示两个不同实体;第二类三元组包含了实体的相关信息,表示为<实体,属性,值>。4.根据权利要求1或3所述的一种基于领域知识图谱的路局配置文件防错系统,其特征在于,单个实体都具有唯一的名称与ID;实体之间的关系包括:调度台与车站之间的管理关系,区间与相邻车站之间的连接关系,...

【专利技术属性】
技术研发人员:盛凯张涛许伟王振一苗长俊曾壹李伟赵宏涛周晓昭孙延浩李智
申请(专利权)人:中国铁道科学研究院集团有限公司北京华铁信息技术有限公司北京锐驰国铁智能运输系统工程技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1