一种政务智能大数据中心体系架构制造技术

技术编号:26531119 阅读:55 留言:0更新日期:2020-12-01 14:11
本申请提出一种政务智能大数据中心体系架构,该方法包括:从内部业务系统、互联网网站及本地文件资源库获取政务源数据;根据预设语义分析模型对采集到的政务源数据进行处理,结合预设业务画像模型生成初步政务数据,支持数据检索和画像数据访问;根据预先训练的语义分析模型和预设数据标准,精细化处理政务源数据,结合预设业务画像模型生成精细政务数据,支持数据共享、统计、分析和挖掘;政务源数据、初步政务数据和精细政务数据存储在政务数据中心;获取政务数据中心运行的结果评估数据,根据结果评估数据优化政务数据中心的人工智能模型。本申请无需线下协商获取内部业务数据库,实现快速数据获取并提供检索服务功能。

【技术实现步骤摘要】
一种政务智能大数据中心体系架构
本申请属于政务管理
,具体涉及一种政务智能大数据中心体系架构。
技术介绍
政务数据中心能够通过对数据的统计、分析及挖掘,为政务单位的日常经营提供数据支撑。随着“互联网+”时代的到来,全球数据爆发式增长,政务领域的数据也是集聚增长,合理利用政务领域的大数据,能够提高政务数据中心的政务服务能力,为用户提供更有效的数据支持。政务大数据建设首先涉及政务单位的内部业务数据的采集共享。相关技术中通过ETL(Extract-transform-load,数据仓库技术)技术来获取政务单位的内部业务数据,ETL技术是面向结构化数据的采集和处理。但由于政务单位的内部业务数据涉及政务单位的商业机密,要想跨部门、跨机构、跨级别的获取业务的系统数据库非常困难,需要与政务单位进行协调,往往需要花费很长时间进行协调,而且协调之后也不一定能够获得,导致政务领域的内部业务数据无法融汇贯通。且获取到的数据需要经过很长时间的整理处理,才能提供给用户使用。
技术实现思路
本申请提出一种政务智能大数据中心体系架构,通过浏本文档来自技高网...

【技术保护点】
1.一种政务智能大数据中心体系架构方法,其特征在于,所述方法包括;/n从内部业务系统、互联网网站及本地文件资源库获取政务源数据;/n根据预设语义分析模型对采集到的政务源数据进行处理,结合预设的业务画像模型生成初步的政务数据,支持数据检索和画像数据访问;/n根据预先训练的语义分析模型和预设的数据标准,对所述政务源数据进行精细化处理,结合预设的业务画像模型生成精细政务数据,支持数据共享、统计、分析和挖掘;/n所述政务源数据、所述初步的政务数据和所述精细政务数据均存储在政务数据中心中;/n自动获取所述政务数据中心运行过程对应的结果评估数据,根据所述结果评估数据优化所述政务数据中心中的人工智能模型。/...

【技术特征摘要】
1.一种政务智能大数据中心体系架构方法,其特征在于,所述方法包括;
从内部业务系统、互联网网站及本地文件资源库获取政务源数据;
根据预设语义分析模型对采集到的政务源数据进行处理,结合预设的业务画像模型生成初步的政务数据,支持数据检索和画像数据访问;
根据预先训练的语义分析模型和预设的数据标准,对所述政务源数据进行精细化处理,结合预设的业务画像模型生成精细政务数据,支持数据共享、统计、分析和挖掘;
所述政务源数据、所述初步的政务数据和所述精细政务数据均存储在政务数据中心中;
自动获取所述政务数据中心运行过程对应的结果评估数据,根据所述结果评估数据优化所述政务数据中心中的人工智能模型。


2.根据权利要求1所述的方法,其特征在于,所述从内部业务系统、互联网网站及本地文件资源库获取政务源数据,包括:
根据内部业务系统的用户账号,通过浏览器访问所述内部业务系统的政务页面;利用爬虫技术抓取所述政务页面的整个页面信息或局部页面信息,所述页面信息包括页面链接、页面标题及文本内容;
利用爬虫技术对互联网网站进行页面抓取,获得互联网网站上的政务相关数据;
通过文件传输协议及格式解析技术采集本地文件资源库中存储的本地文件,从所述本地文件中提取文件数据,所述文件数据包括文件标题、文件格式、文件大小、文本内容和图片。


3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
通过快照技术生成所述页面信息对应的内部系统页面;
通过快照技术生成所述政务相关数据对应的外部网站页面;
将所述内部系统页面和所述外部网站页面存储在所述政务数据中心中。


4.根据权利要求1所述的方法,其特征在于,所述根据预设语义分析模型对采集到的政务源数据进行处理,结合预设的业务画像模型生成初步的政务数据,支持数据检索和画像数据访问,包括:
根据预设的业务画像模型,通过语义分析模型对所述政务源数据进行画像提取,得到画像实例数据;
根据所述预设的业务画像模型对应的预设关键词组合,从所述政务源数据中搜索所述画像实例数据对应的画像关联数据;
将所述画像实例数据及其对应的画像关联数据确定为初步的政务数据。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述政务源数据、所述初步的政务数据导入检索引擎;
基于用户检索请求包括的关键词和/或业务画像,为用户提供政务数据检索服务;
根据用户行为习惯信息和纠错反馈信息,优化检索结果和所述初步的政务数据。


6...

【专利技术属性】
技术研发人员:赵普益赵志军
申请(专利权)人:北京艾巴斯智能科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1