本发明专利技术涉及城市综合应急管理技术领域,具体涉及一种基于突发事件应急管理的知识库引擎构建及其查询方法。本发明专利技术构建知识库时从非结构化文本信息中抽取相关的数据,滤除无用数据并且改进它的结构,确保数据的匀称性;对提取的信息文本内容结构化分析,提取其特征存入特征库,作为该知识的特征词语;对提取的信息经自动分词处理后,依据信息分类标准进行分类处理,建立该知识与分类信息的关联。将知识库的查询主要步骤分为语义理解、知识理解和知识检索。本发明专利技术有效解决了现有知识库的分类存储和精确查询等缺陷;可以应用于突发事件应急管理的知识库引擎构建和查询。
【技术实现步骤摘要】
本专利技术涉及城市综合应急管理
,具体涉及一种。
技术介绍
随着城市的急速发展和现代科学技术的运用,城市系统日趋复杂,综合风险与日俱增,特别是近年来自然灾害和人为灾害频发,给城市安全带来前所未有的挑战。因此,如何强化城市安全机制,对随时可能的突发事件做出及时、有效的响应是当前急需解决的重大课题。通过信息化手段来推动政府职能的现代化建设是各级管理部门的共识。在应急管理领域,各种城市综合应急管理平台应运而生。应急平台使得各行业管理工作得到集中管理和统一指挥,信息实现了互联互通和共享使用,事件处置过程更加规范,有效提高了政府部门的应急处置能力。从知识库平台方面,目前有覆盖广泛领域的、通用的网络版知识库,如百度文库、豆丁网等,也有一些专业的知识库,如深蓝KMPRO知识管理平台、CYC海量知识库等,以及一些特定领域如机械设计领域、故障诊断知识库、论文和专利领域知识库等。这些知识库涉及的领域多种多样,依据知识表示方式的不同以及行业的区别,他们的知识平台构建方式和信息查询使用方式也有很大差异。这些知识库平台的优势在于提供了巨大容量的知识存储空间,形成了高效知识查询。缺陷在于知识的构建,特别是在突发事件应急管理领域知识的分类存储和精确查询还不成熟。而且,由于构建上的缺陷,无法实现智能化的查询。
技术实现思路
本专利技术解决的技术问题之一在于提供一种基于突发事件应急管理的知识库引擎构建;根据应急知识库的特点,使用标准的突发事件分类标准和要素,对应急知识库进行分类和结构化组织,并依照分类处理算法,建立类别库,分类出的数据结构化更完善、信息覆盖面更全面,更切合突发事件应急管理专业化实际。本专利技术解决的技术问题之二在于提供一种基于突发事件应急管理的知识库查询方法;通过利用依据突发事件建立起来的同义词字典、类型词语字典等专有词典,结合特征库和类别库,实现信息的智能化分类查询,查询出的结果精确度更高,显示方式更友善。本专利技术解决上述技术问题之一的技术方案是将整个应用架构分为应用层、应用支撑层、数据层和基础支撑层;应用层主要包括信息录入和信息查询两部分;应用支撑层主要包括信息提取模块、自动分词处理模块和分类处理模块、语义理解模块、知识理解模块、知识检索模块等六大模块;数据层主要包括知识库、特征库和类型库,另外还包括同义词字典、类型词语字典等;基础支撑层主要包括分布式数据库、存储设备、服务器设备和应用工作站、网络、操作系统和中间件等;中间件位于异构的硬件平台和操作系统之上,屏蔽异构的硬件平台和操作系统的差异,并为上层的应用提供诸如负载均衡、事务管理、可靠消息传递等服务。从非结构化文本信息中抽取相关的数据,滤除无用数据并且改进它的结构,确保数据的匀称性;对提取的信息文本内容结构化分析,提取其特征存入特征库,作为该知识的特征词语;对提取的信息经自动分词处理后,对结果进行分类处理,依据信息分类标准进行分类处理,建立该知识与分类信息的关联;特征库和类型库用于用户信息查询时的模式匹配;分析信息查询的日志,把用户的行为习惯挖掘出来反馈给信息录入模块。在信息提取时利用二叉树对自然语言进行分拆,并利用同义词字典实现对同义词的处理。本专利技术解决上述技术问题之二的技术方案是查询主要步骤分为语义理解、知识理解和知识检索;在语义理解中是利用智能分词技术将组成语句的核心词提炼出来供语义分析模块使用;在分词的过程中,首先利用整个语句中的标点符号,把整条语句划分为几个短句,对短句按照字符长短进行划分,划分为词语,遍历到的词语与词典库中的词语进行对比,如在字典中,则提取取出,如果不在字典中,则作为冗余信息过滤掉;知识理解将语义理解过程中提取出的关键字,通过同义词字典,自动联想到同义词,从而利用同义词在特征库中进行关键字查找,对用户提出的问题给出准确度最高、相关性最强、最全面检索结果;知识检索主要包括关键字查找和类型查找,关键字查找是依据同义词字典,在特征库中查找,进而找到相关知识;类型查找是利用该知识与类型建立的关联,确定该知识的类型信息,主要是根据知识库的结构化关联,将通过知识理解查找到的具体知识信息进行知识归纳为具体的类别,给用户以清晰的信息显示。在查询系统中设置用户信息反馈机制,对用户信息进行挖掘;用户根据对查询出的信息内容进行评价和打分,其打分结果影响着信息的判断。本专利技术以突发事件应急处理为主题进行知识库构建,根据应急突发事件处理知识库的特点,分别建立突发事件专有的同义词字典、类型词语字典,依据事件分类标准和知识分类处理方法,实现了突发事件应急处理知识库有效构建、信息快速查询等功能。附图说明下面结合附图对本专利技术进一步说明图1是本专利技术总体框架图;图2是本专利技术应急知识库构建图;图3是本专利技术应急知识库查询流程图;图4是本专利技术知识库分类图。具体实施方式基于突发事件应急管理的知识库引擎是一个以突发事件应急管理行业为导向,可有效地沉淀行业知识,生成解决方案,快速的知识获取及知识库建立、更新、维护、管理、使用的应用平台。它打破了一般的知识库平台的应用模式,专门针对该领域进行了分析与实现,从而使得突发事件应急管理领域知识库知识资产得到最大限度的共享和复用,更有效率的在更大范围内发挥突发事件应急管理领域知识库的核心价值。如图1所示,本专利技术整个应用的架构共分为4层,分别为应用层、应用支撑层、数据层和基础支撑层。知识库引擎设计从应用角度主要包括信息录入和信息查询两部分。信息录入是建立知识库的源泉,信息查询是知识库的具体应用。从支撑功能模块上划分,知识库引擎主要包括信息提取模块、自动分词处理模块和分类处理模块、语义理解模块、知识理解模块、知识检索模块等六大模块。从数据层上划分主要包括知识库、特征库和类型库,另外还包括同义词字典、类型词语字典等。基础支撑层主要包括分布式数据库、存储设备、服务器设备和应用工作站、网络、操作系统和中间件等。中间件位于异构的硬件平台和操作系统之上,它屏蔽了异构的硬件平台和操作系统的差异,并为上层的应用提供诸如负载均衡、事务管理、可靠消息传递等服务。如图2所示,本专利技术知识库引擎构建时,信息录入是基于突发事件应急管理知识库引擎的核心之一,是知识库的数据来源,也是建立高效的知识应用,即信息查询的基础。信息录入处理的好坏影响着信息查询结果以及智能化实现的程度。突发事件知识库信息没有统一的规范,极少数是结构化文本,大部分是非结构化文本。要规范化表达,就要从大量的非结构化文本信息中提取有用的信息进行分析,在数据库中形成结构化而又相互关联的知识库。信息提取是指从非结构化文本信息中抽取相关的数据,滤除无用数据并且改进它的结构,确保数据的匀称性。信息提取的关键是自然语言的理解,我们利用二叉树对自然语言进行分拆,并利用同义词字典实现对同义词的处理。例如2012年4月9日4时31分,位于我市中堂镇的东莞建晖纸业有限公司发生火灾。首先利用标点符号进行分割,分为“2012年4月9日4时31分”,“位于我市中堂镇的东莞建晖纸业有限公司发生火灾”两个短句,针对两个短句,遍历出其中的实词如“中堂镇”、“东莞”、“建晖纸业有限公司”、“火灾”等,利用该实词与字典中的词进行比较,如果在字典中,则提取出来,否则过滤掉。对提取的信息文本内容结构化分析,提取其特征存入特征库,作为该知识的特征本文档来自技高网...
【技术保护点】
一种基于突发事件应急管理的知识库构建,其特征在于:将整个应用架构分为应用层、应用支撑层、数据层和基础支撑层;应用层主要包括信息录入和信息查询两部分;应用支撑层主要包括信息提取模块、自动分词处理模块和分类处理模块、语义理解模块、知识理解模块、知识检索模块等六大模块;数据层主要包括知识库、特征库和类型库,另外还包括同义词字典、类型词语字典等;基础支撑层主要包括分布式数据库、存储设备、服务器设备和应用工作站、网络、操作系统和中间件等;中间件位于异构的硬件平台和操作系统之上,屏蔽异构的硬件平台和操作系统的差异,并为上层的应用提供诸如负载均衡、事务管理、可靠消息传递等服务。
【技术特征摘要】
1.一种基于突发事件应急管理的知识库构建,其特征在于将整个应用架构分为应用层、应用支撑层、数据层和基础支撑层;应用层主要包括信息录入和信息查询两部分;应用支撑层主要包括信息提取模块、自动分词处理模块和分类处理模块、语义理解模块、知识理解模块、知识检索模块等六大模块;数据层主要包括知识库、特征库和类型库,另外还包括同义词字典、类型词语字典等;基础支撑层主要包括分布式数据库、存储设备、服务器设备和应用工作站、网络、操作系统和中间件等;中间件位于异构的硬件平台和操作系统之上,屏蔽异构的硬件平台和操作系统的差异,并为上层的应用提供诸如负载均衡、事务管理、可靠消息传递等服务。2.根据权利要求1所述的知识库构建,其特征在于从非结构化文本信息中抽取相关的数据,滤除无用数据并且改进它的结构,确保数据的匀称性;对提取的信息文本内容结构化分析,提取其特征存入特征库,作为该知识的特征词语;对提取的信息经自动分词处理后,依据信息分类标准进行分类处理,建立该知识与分类信息的关联;特征库和类型库用于用户信息查询时的模式匹配;分析信息查询的日志,把用户的行为习惯挖掘出来反馈给信息录入模块。3.根据权利要求2所述的知识库构建,其特征在于在信息提取时利用二叉树对自然语言进行...
【专利技术属性】
技术研发人员:贺忠堂,李新安,赵锋伟,李智勇,
申请(专利权)人:东莞中国科学院云计算产业技术创新与育成中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。