The invention provides an automatic construction method for the big data knowledge base in the public security field, the steps of which include: establishing the standard system in the public security field; establishing the entity mapping database, storing the main attributes of the entity to the file storage database, pushing the data to the memory storage database, and automatically concatenating the fragment entities; constructing the public security knowledge base: public All data resources in the common security field are classified and displayed by data map; text deep mining is carried out from relational database, open database, semi-structured web page and plain text to extract structured entities, attributes, relationships and events among entities, and then form a cost-effective knowledge expression; entity fusion is carried out for multi-source knowledge to eliminate contradictions and ambiguity To solve the problem of ambiguous entities with the same name and complete the construction of public security domain knowledge base. Beneficial effect: the compilation of safety knowledge base provides basic rules, which makes the compilation of safety knowledge base reasonable and verifiable.
【技术实现步骤摘要】
一种用于公共安全领域大数据知识库的自动化构建方法
本专利技术涉及一种大数据知识库的自动化构建方法,具体涉及一种用于公共安全领域大数据知识库的自动化构建方法。
技术介绍
信息技术的发展不断推动着互联网技术的变革,搜索引擎由于使得用户寻找信息的范围缩小,已经成为人们查找海量信息不可或缺的工具。知识库概念由谷歌公司最先提出,谷歌公司想在知识库项目的基础上,构建新一代的智能化搜索引擎。该搜索引擎的思想是从网页上获得各类知识的实体、属性信息,以及各实体之间的关联关系,从而建立知识的语义网络。传统的搜索引擎都是基于字符串的搜索,而不是根据相应的语义信息进行搜索,因此传统的搜索引擎可能会搜索出与语义毫不相关的信息,而仅仅包含该字符串,而基于知识库的搜索是基于语义分析的,因而搜索更加精确。知识库的构建对于知识的展示与检索具有很高的研究价值,在国内百度和搜狗分别推出了“知心”和“知立方”来改善其搜索质量。清华大学建立了第一个大规模中英文跨语言知识库,中科院在开放网络的基础上研发了“人立方、事立方、知立方”的原型系统。目 ...
【技术保护点】
1.一种用于公共安全领域大数据知识库的自动化构建方法,其特征在于,其步骤包括:/n步骤S1,建立公共安全领域标准体系;/n步骤S2,建立实体映射库,将实体的主要属性存储到文件存储数据库,将数据推送至内存存储数据库,进行碎片实体自动化串联;/n步骤S3,构建公共安全领域知识库:/n步骤S31,对公共安全领域所有数据资源进行数据地图分类展示;/n步骤S32,从关系型数据库、开放数据库、半结构化网页、纯文本中进行文本深度挖掘,提取出结构化的实体、属性以及实体间的关系、事件,并在此基础上形成本体化的知识表达;/n步骤S33,对多源知识进行实体融合,消除矛盾和歧义,解决同名实体产生歧 ...
【技术特征摘要】 【专利技术属性】
1.一种用于公共安全领域大数据知识库的自动化构建方法,其特征在于,其步骤包括:
步骤S1,建立公共安全领域标准体系;
步骤S2,建立实体映射库,将实体的主要属性存储到文件存储数据库,将数据推送至内存存储数据库,进行碎片实体自动化串联;
步骤S3,构建公共安全领域知识库:
步骤S31,对公共安全领域所有数据资源进行数据地图分类展示;
步骤S32,从关系型数据库、开放数据库、半结构化网页、纯文本中进行文本深度挖掘,提取出结构化的实体、属性以及实体间的关系、事件,并在此基础上形成本体化的知识表达;
步骤S33,对多源知识进行实体融合,消除矛盾和歧义,解决同名实体产生歧义的问题,完成公共安全领域知识库的构建。
2.如权利要求1所述的用于公共安全领域大数据知识库的自动化构建方法,其特征在于,在上述步骤S31中,通过人机协同模式进行语料标注不同数据资源对应数据的实体类型,根据数据元标准自动化标准不同实体的关联规则和标签规则,通过数据地图自动显示不同实体之间的关联关系。
3.根据权利要求1所述的用于公共安全领域大数据知识库的自动化构建方法,其特征在于,还包括:步骤S4,通过权威度、冗余度、多样性、一致性进行知识验证,判断新知识是否正确。
技术研发人员:董大旻,韩军华,
申请(专利权)人:飞越无限苏州科技发展有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。