一种交通行业时序知识图谱存储编码及知识管理方法技术

技术编号:35362358 阅读:20 留言:0更新日期:2022-10-29 18:00
本发明专利技术涉及数据治理知识管理技术领域,具体涉及一种交通行业时序知识图谱存储编码及知识管理方法。本发明专利技术核心是提供一种交通行业大数据时序知识图谱存储模型,包括时间特征属性分类及编码规则模型,交通行业本体分类及编码规则模型,交通行业实体ID及其编码规则模型,交通行业本体属性特征分类编码规则模型,关系类型编码规则模型,关系实例ID及其编码规则模型,关系规则的定义及其编码产生规则模型,行业知识实体特征内容存储表编码规则模型,关系实例存储表编码规则模型,关系实例扩展特征属性存储表编码规则模型;同时,本发明专利技术通过上述模型,提出了相应的动态知识管理方法,包括本体及属性,关系及属性等的全生命周期管理和知识探索等。期管理和知识探索等。期管理和知识探索等。

【技术实现步骤摘要】
一种交通行业时序知识图谱存储编码及知识管理方法


[0001]本专利技术涉及数据治理知识管理
,具体涉及一种交通行业时序知识图谱存储编码及知识管理方法。

技术介绍

[0002]大数据环境下,大规模、形式多样、零散分布、动态变化、质量低下的数据特征给知识工程等人工智能技术提出了新的挑战,不仅需要从感知角度学习数据的分布表示,还需要从认知角度解释数据的语义。研发融合常识知识图谱、认知推理和逻辑表达等核心技术的认知图谱将成为实现下一代人工智能技术突破的关键。
[0003]交通系统建设领域从交通信息化开始产生数据,正在经历一个从智能交通走向智慧交通的过程。智能交通是在交通系统中引入信息技术所产生的解决方案,而智慧交通则是采用人工智能技术和政策手段,解决交通领域社会问题的人机混合系统。
[0004]在大数据、云计算、人工智能等新一代信息和智能技术快速发展的大背景下,如何通过类人大脑的感知、认知、协调、学习、控制、决策、反馈、创新创造等综合智能,对交通行业相关信息进行全面获取、深度分析、综合研判、智能生成对策方案、精准决策来更好地实现对交通行业的治理和服务,破解交通的问题并提供系统的综合服务是智慧交通系统的核心中枢,这就需要以系统化,体系化的方式将各类分散的数据,隐形的数据和知识加以规范存储,为解决交通大数据环境下的复杂问题决策提供基础保障。
[0005]如何将这些数据异常庞大,纷繁复杂的数据治理并标记编码为含有深度行业语义内容的知识,并将这些具有行业语义内容的及随时间变化的事实知识加以全面关联,现有技术只对需要分析的数据结果提出了要求,但对如何达成需要的数据结果有如下的缺点:
[0006]1.只关注静态行业知识图谱,不会随时间变化;
[0007]2.没有对跨行业多源大数据环境下,对数据进行过统一的知识概念提取,一些行业常识数据不断重复构造;
[0008]3.需要在开始的时候就设计好知识管理的本体架构,没有工具来将设计好的本体逐步叠加完善,最终形成一个完整的本体体系;
[0009]4.知识图谱构建中,缺少动态时序关系数据的统一存储及提取方法;
[0010]5.静态知识图谱与时变的事实数据形成超级节点,数据规模大导致时序知识提取及分析无法在有效时间进行;
[0011]6.跨行业数据治理是以应用为导向,而不是以知识沉淀,知识管理为导向,数据汇聚产生的新应用,又形成大量新的数据孤岛;
[0012]7.静态交通网络与动态的交通时序事实数据,不能快速关联并检索;
[0013]8.没有对如何完成行业时序知识图谱存储编码及知识管理提供完整的解决方案,模型和算法。

技术实现思路

[0014]本专利技术的目的是针对现有技术中的不足,提出一种行业时序知识图谱存储编码及知识管理方法,对包含交通领域本体元数据、属性、定义、关联关系、分类方法等内容进行存储编码及知识管理,解决跨领域、跨系统的业务可解释性需求,提供数据的一致性、完整性和准确性,进而形成跨行业交通大数据的全息知识图谱,促进人类知识在交通领域利用机器快速响应及推理计算,构建人类与机器之间的共生伙伴关系。
[0015]为实现上述目的,本专利技术公开了如下技术方案:
[0016]一种时间特征属性分类及其编码方法,其特征在于,将时间特征属性分为以下十类,设定为2位编码的体系,由以下内容组成:
[0017]●
静态:编码ST,不随时间变化的特征属性值,英文全称STATIC;
[0018]●
实时:编码RE,实时变化的特征属性值,英文全称REALTIME;
[0019]●
秒:编码SE,按照秒变化的特征属性值,英文全称SECOND;
[0020]●
分钟:编码MI,按照分钟变化的特征属性值,英文全称MINUTE;
[0021]●
小时:编码HO,按照小时变化的特征属性值,英文全称HOUR;
[0022]●
天:编码DA,按照天变化的特征属性值,英文全称DAY;
[0023]●
周:编码WE,按照周变化的特征属性值,英文全称WEEK;
[0024]●
月:编码MO,按照月变化的特征属性值,英文全称MONTH;
[0025]●
年:编码YE,按照年变化的特征属性值,英文全称YEAR;
[0026]●
随机:编码RA,随机时间段变化的特征属性值,英文全称RANDOM;
[0027]一种行业知识本体分类及其编码体系,其特征在于,本体编码4 位,支持3级知识本体分类体系,一级为本体大类编码,占1位,二级为本体二类编码,占1位,三级分类为本体名称编码,占2位;由以下内容组成:。
[0028]●
本体编码4位,由数字0

9和26位大写英文字母A

Z组成,如“省”本体编码为S001。
[0029]●
本体大类的编码为1位大写英文字母,A

Z,共可分26个大类,其中,以下八类本体大类为系统内置的本体大类:
[0030]1)空间类:编码S,SPACE的首字母。
[0031]2)环境类:编码E,ENVIRONMENT的首字母。
[0032]3)机构类:编码D,DEPARTMENT的首字母。
[0033]4)人员类:编码H,HUMAN的首字母。
[0034]5)车辆类:编码V,VEHICLE的首字母。
[0035]6)设备类:编码F,FACILITY的首字母。
[0036]7)事件类:编码C,CASE的首字母。
[0037]8)方案类:编码P,PLAN的首字母。
[0038]●
本体二类的编码为2位,其中第一位编码为本体大类编码,第 2位编码为1位数字0

9或1位大写英文字母A

Z,每个本体大类下共可区分36类本体二类。
[0039]●
本体的编码为4位,其中第1位为本体大类编码,第2位为本体二类编码,第3位为数字0

9或1位大写英文字母A

Z,第 4位为数字0

9或1位大写英文字母A

Z,如空间(S)

行政区划(0)

国家(00)的本体编码为S000。空间(S)

行政区划(0)

省区(01)的本体编码为
S001。
[0040]一种行业知识实体ID及其编码方法,其特征在于,将行业知识实体ID设定为20位的字典编码体系,生成行业知识实体的唯一标识(类似身份证号),由以下内容组成:行业知识实体ID=知识本体大类编码(1位)+知识本体二类编码(1位)+知识本体编码(2位)+行政区划编码(6位)+随机序列(10位)。20位为 00000000000000000000代表未知的实体,为占位ID。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行业知识本体分类及其编码体系,其特征在于,本体编码4位,支持3级知识本体分类体系,一级为本体大类编码,占1位,二级为本体二类编码,占1位,三级分类为本体名称编码,占2位;由以下内容组成:。

本体编码4位,由数字0

9和26位大写英文字母A

Z组成,如“省”本体编码为S001。

本体大类的编码为1位大写英文字母,A

Z,共可分26个大类,其中,以下八类本体大类为系统内置的本体大类:1)空间类:编码S,SPACE的首字母。2)环境类:编码E,ENVIRONMENT的首字母。3)机构类:编码D,DEPARTMENT的首字母。4)人员类:编码H,HUMAN的首字母。5)车辆类:编码V,VEHICLE的首字母。6)设备类:编码F,FACILITY的首字母。7)事件类:编码C,CASE的首字母。8)方案类:编码P,PLAN的首字母。

本体二类的编码为2位,其中第一位编码为本体大类编码,第2位编码为1位数字0

9或1位大写英文字母A

Z,每个本体大类下共可区分36类本体二类。

本体的编码为4位,其中第1位为本体大类编码,第2位为本体二类编码,第3位为数字0

9或1位大写英文字母A

Z,第4位为数字0

9或1位大写英文字母A

Z,如空间(S)

行政区划(0)

国家(00)的本体编码为S000。空间(S)

行政区划(0)

省区(01)的本体编码为S001。以上本体编码规则,共可覆盖共26*36*36*36=1213056类本体。2.一种行业知识实体ID及其编码方法,其特征在于,将行业知识实体ID设定为20位的字典编码体系,生成行业知识实体的唯一标识(类似身份证号),由以下内容组成:行业知识实体ID=知识本体大类编码(1位)+知识本体二类编码(1位)+知识本体编码(2位)+行政区划编码(6位)+随机序列(10位)。20位为00000000000000000000代表未知的实体,为占位ID。实体编码为20位,可覆盖1213056*100*100亿个实体。本体编码(4位)+行政区划编码(6位)+实体ID(10位随机数),如空间

行政区划

省实体“贵州省”编码为S001550000*********。每个实体,都需要属于某一类本体,才能进入行业知识图谱系统中,以保证实体的唯一性。3.一种行业本体属性特征分类编码方法,其特征在于,将本体属性分类编码设计6位,支持2级分类体系,由时间类型编码(2位)和本体属性字段分类编码(4位)构成,即本体属性类型编码(6位)=时间类型编码(2位)+本体属性字段分类名称(4位)。时间特征属性类型编码2位,参考1“时间特征属性类型编码”定义;本体属性字段分类编码为4位数字和大写英文字母组成组成,数字0

9,英文字母A

Z,共可覆盖1679616类属性分类。4.一种关系类型编码方法,其特征在于,将关系分类编码设计为8 位,支持2级分类体系,由时间特征属性类型编码(2位)和关系属性字段分类编码(6位)构成,即关系类型编码8位=时间特征属性类型编码(2位)+关系名称编码(6位)。时间特征属性类型编码2位,参考1“时间特征属性类型编码”定义;关系属性字段分类编码为4位数字和大写英文字母组成组成,数字0

9,英文字母A

Z,共可覆盖1679616类属性分类。5.一种关系实例ID及其编码方法,其特征在于,关系实例ID编码为18位,生成关系实例的唯一标识,可覆盖26*10万*100亿个关系实例。关系实例ID编码由关系类型编码(8位)和
随机ID(10位随机数)组成,如贵州
‑‑
省会

>贵阳(省区
‑‑
省会

>地市),这个特定的省会关系实例编码为ST00001**********。6.一种关系规则的定义及其编码产生方法,...

【专利技术属性】
技术研发人员:ꢀ五一IntClG零六F一六三六
申请(专利权)人:网帅科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1