【技术实现步骤摘要】
一种用于公共安全领域大数据知识图谱的自动化构建方法
本专利技术涉及数据挖掘、人工智能
,具体的说是一种用于公共安全领域大数据知识图谱的自动化构建方法。
技术介绍
信息技术的发展不断推动着互联网技术的变革,搜索引擎由于使得用户寻找信息的范围缩小,已经成为人们查找海量信息不可或缺的工具。知识图谱的概念在2012年由谷歌公司最先提出,谷歌公司想在知识图谱项目的基础上,构建新一代的智能化搜索引擎。该搜索引擎的思想是从网页上获得各类知识的实体、属性信息,以及各实体之间的关联关系,从而建立知识的语义网络。传统的搜索引擎都是基于字符串的搜索,而不是根据相应的语义信息进行搜索,因此传统的搜索引擎可能会搜索出与语义毫不相关的信息,而仅仅包含该字符串,而基于知识图谱的搜索是基于语义分析的,因而搜索更加精确。知识图谱的构建对于知识的展示与检索具有很高的研究价值,在国内百度和搜狗分别推出了“知心”和“知立方”来改善其搜索质量。清华大学建立了第一个大规模中英文跨语言知识图谱XLore,中科院在开放网络的基础上研发了“人立方、事立方、知立方”的原型系统。目前随着中国经济的高速发展以及对 ...
【技术保护点】
1.一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,其实现过程包括:步骤一,根据公共安全所涉及领域建立标准体系,确保多源异构数据的融汇贯通和深度智能挖掘有章可循;步骤二,建立公共安全领域实体映射库Entity‑Mapping,将实体的主要属性存储到文件存储数据库,将数据推送至内存存储数据库,进行碎片实体自动化串联;步骤三,将数据抽象成实体、关系、事件三大类,构建公共安全领域知识图谱:1)通过知识建模工具对公共安全领域所有数据资源进行数据地图分类展示,通过人机协同模式进行语料标注不同数据资源对应数据的实体类型,根据数据元标准自动化标准不同实体的关联规则和标签规 ...
【技术特征摘要】
1.一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,其实现过程包括:步骤一,根据公共安全所涉及领域建立标准体系,确保多源异构数据的融汇贯通和深度智能挖掘有章可循;步骤二,建立公共安全领域实体映射库Entity-Mapping,将实体的主要属性存储到文件存储数据库,将数据推送至内存存储数据库,进行碎片实体自动化串联;步骤三,将数据抽象成实体、关系、事件三大类,构建公共安全领域知识图谱:1)通过知识建模工具对公共安全领域所有数据资源进行数据地图分类展示,通过人机协同模式进行语料标注不同数据资源对应数据的实体类型,根据数据元标准自动化标准不同实体的关联规则和标签规则,通过数据地图自动显示不同实体之间的关联关系;2)依托机器学习和深度学习服务进行文本深度挖掘,提取出结构化的实体、属性以及实体间的关系、事件,并在此基础上形成本体化的知识表达;3)对多源知识进行实体融合,消除矛盾和歧义,解决同名实体产生歧义的问题,完成公共安全领域知识图谱的构建。2.根据权利要求1所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,其实现过程还包括:通过权威度、冗余度、多样性、一致性进行知识验证,判断新知识是否正确;多次验证,通过对图谱密度、中心性特征、孤立节点和比例、属性填充率完成知识图谱的质量管控。3.根据权利要求2所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,通过自生长优化、应用反馈优化、业务分析人员反馈优化三种数据优化方式对构建的公共安全领域知识图谱进行优化,提升构建公共安全领域知识图谱的完整性;其中,自生长优化主要采用数据挖掘分类算法对实体进行分析,对实体的属性、关联、标签进行自动关联。4.根据权利要求1或2或3所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,其实现过程还包括:通过公共安全领域知识图谱的建模数据、公共安全领域实体映射库的数据、用户搜索行为数据,通过变长命令序列检测模型分析用户搜索意图,根据用户搜索行为数据建立序列,定义一个集合C={l(1)<l(2)<…<l(n)},在样本序列库建立映射,明确n确定的情况下,C的取值不同范围,进而完成公共安全领域搜索意图解析器的构建。5.根据权利要求4所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特...
【专利技术属性】
技术研发人员:李存冰,
申请(专利权)人:浪潮软件股份有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。