【技术实现步骤摘要】
一种政务通用大数据聚合检索系统及构建方法
本专利技术涉及一种政务通用大数据聚合检索系统及构建方法,属于电子信息
技术介绍
随着大数据时代的到来,政府机关面临人口数据、单位数据、财务数据、业务数据呈几何倍数增长的问题。面对数据内容多元化,数据量级海量化、数据形式虚拟化的情况,传统的数据分析处理模式往往存在大海捞针、无从下手的局面,若要对数据进行快速解析和应用,需要投入巨大的计算资源,使用和维护成本更难以控制,也难以满足复杂多变的业务定制化需求。因此,在现有基础设施和数据环境下,如何利用大数据处理技术,采用多种数据架构的融合,创新数据处理技术,是当前基层单位增强国家治理的监督、评价、防御功能,推动政府机关信息化建设的重要问题。随着大数据项目建设的持续深入,数据积累已经初具规模,网络互联互通能力也得到进一步提升,政府部门之间能够通过大数据平台进行数据交换,但是在数据利用方面还普遍存在以下问题:一是数据多元化;政府部门在处理业务时需要获取多方面的数据;比如各部门行政审批数据、财政预算执行、地税征管、 ...
【技术保护点】
1.一种政务通用大数据聚合检索系统,其特征在于,所述系统包括数据源层、检索库层、图形库层和权限控制层;/n所述数据源层用于将各类政务数据按照数据存储类型划分为结构化数据、非结构化数据和文本数据;/n所述检索库层用于将所有数据存储类型的数据按照倒序索引方式重新组织,并按照词条方式对所有的数据进行解析分类,形成统一的搜索引擎,得到统一检索库;/n所述图形库层用于根据统一检索库中的数据中的实体之间的关系建立图数据库,得到实体图谱;/n所述权限控制层用于根据数据源层中的数据的安全等级控制图数据库中对应数据的查看权限。/n
【技术特征摘要】
1.一种政务通用大数据聚合检索系统,其特征在于,所述系统包括数据源层、检索库层、图形库层和权限控制层;
所述数据源层用于将各类政务数据按照数据存储类型划分为结构化数据、非结构化数据和文本数据;
所述检索库层用于将所有数据存储类型的数据按照倒序索引方式重新组织,并按照词条方式对所有的数据进行解析分类,形成统一的搜索引擎,得到统一检索库;
所述图形库层用于根据统一检索库中的数据中的实体之间的关系建立图数据库,得到实体图谱;
所述权限控制层用于根据数据源层中的数据的安全等级控制图数据库中对应数据的查看权限。
2.根据权利要求1所述的政务通用大数据聚合检索系统,其特征在于,所述各类政务数据包括工商数据、税务数据、社保数据、财政数据、公积金数据、公安数据、民政数据和交通数据;
所述将所有数据存储类型的数据按照倒序索引方式重新组织,并按照词条方式对所有的数据进行解析分类,形成统一的搜索引擎,得到统一检索库,包括:
对其中的结构化数据,通过ETL工具kettle进行处理,将其转变为倒序索引的分词数据,存储进入统一的检索库中;
对于其中的非结构化数据和文本数据,通过POI技术进行文字提取和识别,以倒序索引方式存储进入统一的检索库中。
3.根据权利要求2所述的政务通用大数据聚合检索系统,其特征在于,所述词条方式指对数据的分词和类型进行归类。
4.根据权利要求3所述的政务通用大数据聚合检索系统,其特征在于,所述根据统一检索库中的数据中的实体之间的关系建立图数据库,得到实体图谱,包括:
确定所述各类政务数据中的实体及各实体对应的各种属性,所述实体包括人、单位、资产和资金;
根据政务的逻辑需要,通...
【专利技术属性】
技术研发人员:陈华,初怀远,孙大伟,仲宏伟,
申请(专利权)人:江苏开拓信息与系统有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。