一种事理知识图谱构建方法及系统技术方案

技术编号:17994490 阅读:87 留言:0更新日期:2018-05-19 11:41
本发明专利技术涉及一种事理知识图谱构建方法及系统,该构建系统包括:宏观事件层构建模块、微观知识层构建模块、关系映射模块、本体层构建模块和事理知识图谱生成模块;所述宏观事件层构建模块包括:事件实体抽取单元、事件演化单元和因果关系抽取单元;所述微观知识层构建模块包括:微观实体抽取单元。本发明专利技术通过从结构化数据中获取事件实体和微观实体,分别构建宏观事件层和微观实体层,并抽取不同事件实体之间的因果关系映射到微观实体中,通过对微观实体层中微观实体的关系、类型和因果关系进行抽象和归纳,由此判断事件形成突发性群体响应的本质原因,对突发事件进行预警预测。

A method and system for constructing knowledge map

The invention relates to a method and system for constructing knowledge map, which includes: macro event layer construction module, micro knowledge layer building module, relationship mapping module, ontology layer building module and knowledge map generating module, and the macro event layer modeling block includes event entity extraction unit and event. The microcosmic knowledge layer construction module comprises a microcosmic entity extraction unit. By obtaining event entities and microscopic entities from structured data, this invention constructs macro event layer and microscopic entity layer respectively, and maps the causality between different event entities into microscopic entities, abstracts and induces the relationship, type and causality of microscopic entity in the microscopic entity layer. We should judge the essential reasons for the sudden group reaction and predict the unexpected events.

【技术实现步骤摘要】
一种事理知识图谱构建方法及系统
本专利技术涉及信息挖掘
,尤其涉及一种事理知识图谱构建方法及系统。
技术介绍
随着虚拟化、云计算等互联网技术的广泛应用,特别是社会化媒体,诸如微博、微信等在民众中的飞速发展与广泛普及,网络空间较现实社会更频繁的成为个体交流和情感表达的场所。以世界著名的在线社交网站Facebook为例,2011年底其月活跃用户已达8.45亿,而在2014年,微信的月活跃用户数超过8.06亿(2014年全国人口为13.68亿人)。覆盖面如此广泛的社会化媒体一方面能够大幅度降低获取信息的难度,为人们日常工作生活带来便利;另一方面也由于管控成本及时效的原因,导致部分携带虚假、负面信息的内容极易大范围扩散,乃至形成一些应激突发性的恶性群体性事件。近年来,知识图谱相关技术由于其广泛的应用场景与灵活高效的归纳、推理、分析手段而广为人知。作为知识图谱技术的原始模型,1977年E.A.Feigenbaum首次提出知识工程的概念并通过恰当利用计算机处理分析特定专业领域数据来解决实际应用。2012年,谷歌基于大量前期研究与应用提出了知识图谱项目,其最初目标为满足用户智能搜索需求,为用户提供附带推理分析功能的智能搜索结果。在此基础上,伴随着大量相关应用于研究发现,知识图谱附带的本体层能够有效归纳知识的本质特征,为实现基于知识的推理提供了保证。但知识图谱的结构与构建方式需要根据实际的应用环境进行有针对性的调整,才能真正付诸使用。
技术实现思路
为了解决现有技术存在的问题,本专利技术的至少一个实施例提供了一种事理知识图谱构建方法,包括:从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层,通过聚合演化使所述宏观事件层内的事件实体之间形成事件演化链,并基于事件演化链抽取事件实体之间的因果关系;从所述结构化数据中抽取微观实体组成微观知识层,根据事件实体与微观实体之间的映射关系,将所述因果关系映射到所述微观知识层;对所述微观知识层的微观实体和微观实体间的因果关系进行抽象和归纳,形成事理知识本体层,由所述宏观事件层、微观知识层和事理知识本体层构成事理知识图谱。可选的,所述通过知识抽取技术从所述结构化数据中抽取微观实体组成微观知识层,具体包括:通过命名实体识别、实体间关系抽取和实体属性抽取技术从所述结构化数据中抽取实体、实体间关系和实体属性,组成包括所述实体、实体间关系和实体属性的微观实体,并通过所述微观实体组成微观知识层。可选的,所述从所述结构化数据中抽取微观实体组成微观知识层,还包括:对抽取得到的所述实体和实体间关系进行指代消歧和共指消解处理;基于预存储的实体关系的连通图对所述实体进行关系预测,得到预测实体间关系,并将所述预测实体间关系添加到所述实体间关系中。可选的,从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层,具体包括:对所述结构化数据进行快速事件检测得到所有待处理事件实体;对所有所述待处理事件实体分别进行事件实体属性抽取,分别得到每一组待处理事件实体的事件实体属性组,事件实体属性组中事件实体属性的种类包括:标题、时间、地点、人物、类型、情感和关键词;将事件实体属性的类型与所述预设置类型相同的待处理事件实体作为所述事件实体,并通过所有所述事件实体组成宏观事件层。可选的,所述从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层之前,还包括:通过基于流式异常图检测的事件检测算法从数据源中获取各种类型的源数据,并对所述源数据进行预处理,得到所述结构化数据;所述预处理包括:采集、清洗和规范化。本专利技术实施例还提供了一种事理知识图谱构建系统,包括:宏观事件层构建模块、微观知识层构建模块、关系映射模块、本体层构建模块和事理知识图谱生成模块;所述宏观事件层构建模块包括:事件实体抽取单元、事件演化单元和因果关系抽取单元;所述微观知识层构建模块包括:微观实体抽取单元;所述宏观事件层构建模块,用于通过所述事件实体抽取单元从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层;所述事件演化单元,用于通过聚合演化使所述宏观事件层内的事件实体之间形成事件演化链;所述因果关系抽取单元,用于基于事件演化链抽取事件实体之间的因果关系;所述微观知识层构建模块,用于通过微观实体抽取单元利用知识抽取技术从所述结构化数据中抽取微观实体组成微观知识层;所述关系映射模块,用于根据事件实体与微观实体之间的映射关系,将所述因果关系映射到所述微观知识层;所述本体层构建模块,用于对所述微观知识层的微观实体和微观实体间的因果关系进行抽象和归纳,形成事理知识本体层;事理知识图谱生成模块,用于由所述宏观事件层、微观知识层和事理知识本体层构成事理知识图谱。可选的,微观知识层构建模块,具体用于,通过微观实体抽取单元利用命名实体识别、实体间关系抽取和实体属性抽取技术从所述结构化数据中抽取实体、实体间关系和实体属性,组成包括所述实体、实体间关系和实体属性的微观实体,并通过所述微观实体组成微观知识层。可选的,所述微观知识层构建模块还包括:微观实体融合单元,用于对抽取得到的所述实体和实体间关系进行指代消歧和共指消解处理;并基于预存储的实体关系的连通图对所述实体进行关系预测,得到预测实体间关系,将所述预测实体间关系添加到所述实体间关系中。可选的,所述宏观事件层构建模块,具体用于,通过所述事件实体抽取单元对所述结构化数据进行快速事件检测得到所有待处理事件实体;对所有所述待处理事件实体分别进行事件实体属性抽取,分别得到每一组待处理事件实体的事件实体属性组;将事件实体属性的类型与所述预设置类型相同的待处理事件实体作为所述事件实体,并通过所有所述事件实体组成宏观事件层;事件实体属性组中事件实体属性的种类包括:标题、时间、地点、人物、类型、情感和关键词。可选的,该构建系统还包括:数据清洗模块,用于通过基于流式异常图检测的事件检测算法从数据源中获取各种类型的源数据,并对所述源数据进行预处理,得到所述结构化数据;所述预处理包括:采集、清洗和规范化。本专利技术的上述技术方案与现有技术相比具有如下优点:本专利技术通过从结构化数据中获取事件实体和微观实体,分别构建宏观事件层和微观实体层,并抽取不同事件实体之间的因果关系映射到微观实体中,通过对微观实体层中微观实体的关系、类型和因果关系进行抽象和归纳,由此判断事件形成突发性群体响应的本质原因,对突发事件进行预警预测。附图说明图1是本专利技术实施例提供的一种事理知识图谱构建方法流程示意图;图2是本专利技术另一实施例提供的一种事理知识图谱构建系统结构示意图;图3是本专利技术另一实施例提供的一种事理知识图谱构建系统结构示意图其一;图4是本专利技术又一实施例提供的一种事理知识图谱中因果关系映射实例结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,本专利技术实施例提供的一种事理知识图谱构建方法,包括:从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层,通过聚合演化使宏观事件层本文档来自技高网...
一种事理知识图谱构建方法及系统

【技术保护点】
一种事理知识图谱构建方法,其特征在于,包括:从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层,通过聚合演化使所述宏观事件层内的事件实体之间形成事件演化链,并基于事件演化链抽取事件实体之间的因果关系;从所述结构化数据中抽取微观实体组成微观知识层,根据事件实体与微观实体之间的映射关系,将所述因果关系映射到所述微观知识层;对所述微观知识层的微观实体和微观实体间的因果关系进行抽象和归纳,形成事理知识本体层,由所述宏观事件层、微观知识层和事理知识本体层构成事理知识图谱。

【技术特征摘要】
1.一种事理知识图谱构建方法,其特征在于,包括:从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层,通过聚合演化使所述宏观事件层内的事件实体之间形成事件演化链,并基于事件演化链抽取事件实体之间的因果关系;从所述结构化数据中抽取微观实体组成微观知识层,根据事件实体与微观实体之间的映射关系,将所述因果关系映射到所述微观知识层;对所述微观知识层的微观实体和微观实体间的因果关系进行抽象和归纳,形成事理知识本体层,由所述宏观事件层、微观知识层和事理知识本体层构成事理知识图谱。2.根据权利要求1所述的一种事理知识图谱构建方法,其特征在于,所述从所述结构化数据中抽取微观实体组成微观知识层,具体包括:通过命名实体识别、实体间关系抽取和实体属性抽取技术从所述结构化数据中抽取实体、实体间关系和实体属性,组成包括所述实体、实体间关系和实体属性的微观实体,并通过所述微观实体组成微观知识层。3.根据权利要求2所述的一种事理知识图谱构建方法,其特征在于,所述通过知识抽取技术从所述结构化数据中抽取微观实体组成微观知识层,还包括:对抽取得到的所述实体和实体间关系进行指代消歧和共指消解处理;基于预存储的实体关系的连通图对所述实体进行关系预测,得到预测实体间关系,并将所述预测实体间关系添加到所述实体间关系中。4.根据权利要求1所述的一种事理知识图谱构建方法,其特征在于,从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层,具体包括:对所述结构化数据进行快速事件检测得到所有待处理事件实体;对所有所述待处理事件实体分别进行事件实体属性抽取,分别得到每一组待处理事件实体的事件实体属性组,事件实体属性组中事件实体属性的种类包括:标题、时间、地点、人物、类型、情感和关键词;将事件实体属性的类型与所述预设置类型相同的待处理事件实体作为所述事件实体,并通过所有所述事件实体组成宏观事件层。5.根据权利要求1-4中任一所述的一种事理知识图谱构建方法,其特征在于,所述从结构化数据中抽取具有预设置类型的事件实体构成宏观事件层之前,还包括:通过基于流式异常图检测的事件检测算法从数据源中获取各种类型的源数据,并对所述源数据进行预处理,得到所述结构化数据;所述预处理包括:采集、清洗和规范化。6.一种事理知识图谱构建系统,其特征在于,包括:宏观事件层构建模块、微观知识层构建模块、关系映射模块、本体层构建模块和事理知识图谱生成模...

【专利技术属性】
技术研发人员:王丽宏李晨贺敏毛乾任聂健钟盛海刘靖马宏远刘玮
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1