A knowledge service oriented scientific data processing and forecasting analysis platform, including: data processing module: data specification extraction, abnormal data recognition processing, the standard data list; data analysis module is used to obtain a normalized data, data analysis model, relational model data extraction and visualization to display view platform; the results will be used to: Application module data processing module and data analysis module for the WEB application, so that users can browse, query, statistics and research data. Its advantages are: capable of handling different data sources, and ultimately to the unified format output, convenient for the user to retrieve data according to different requirements; specification of sustainable utilization of the data list in the most intuitive visual presentation to the user.
【技术实现步骤摘要】
本专利技术涉及数据处理操作的系统或方法,涉及专门适用于教育部门的系统或方法,尤指一种面向知识服务的科研数据处理和预测性分析平台。
技术介绍
随着信息技术的发展和科研传播的全球化,机构科研成果成为国际各高校及科研院所等单位衡量其基础研究实力的评价标准,众多高校将职称评定、绩效考核、院系奖金等与科研产出和影响力直接挂钩,以此提高科研积极性。另外机构量化的科研数据为学校及相关部门再进行院系重组、发展调整和规划等重大决策时,提供了客观的事实依据。近年来国内各大高校都把三大文摘数据库(SCI-E、CPCI-S、EI)的论文收录作为学科水平和学术地位的重要指标,另外一些文摘数据库如:SCOPUS作为后起之秀也正在不断扩大其影响力。由于各系统数据收录标准、覆盖范围、数据格式各有不同,而数据本身也会存在错录、误录等诸多不规范情况。往往难以满足机构对数据进行跨平台、跨系统、随机、多选择的调用,不利于机构对科研数据的有效管理和利用。其缺点主要有:1、数据库规范不一,检全率、检准率低,全面获取机构成果成本高。如机构写法不规范、不统一、更名、同名机构、据拼写错误或字段设置问题等导致的漏检、误检。2、由于不同平台之间数据的非规范性以及部分隐形数据没有有效的清洗提炼,用户难以直接通过不同平台获取其所需要的直接数据。如难以统计不同院系的发文及贡献率,本校第一机构、通讯机构的成果统计。3、数据没有有效的进行数据存储、转换,数据再利用率非常低。
技术实现思路
针对现有技术的缺点,本专利技术的目的在于提供一种面向知识服务的科研数据处理和预测性分析平台。提供科研数据的一站式管理、查询和预测性分析 ...
【技术保护点】
一种面向知识服务的科研数据处理和预测性分析平台,其特征在于包括:数据处理模块:以国际主流的文摘数据库特定格式接收数据,将不同来源数据库的对应字段、著录规则、存储要求进行统一,将不同来源数据库转化为本平台所需要的数据,对数据进行规范提取,进行异常数据的识别和筛选,将异常数据提取出来以便人工识别,对错误数据重新识别提取;将处理后的数据进行去重处理,并进行MD5加密,规范后数据可通过ES索引实现对数据分析、查询操作;数据分析模块:用于获取规范后的数据、建立数据分析模型、从关系模型中抽取数据并以可视化视图展示出来;平台应用模块:用于将数据处理模块以及数据分析模块的结果提供给WEB应用程序,以便用户查询、浏览、统计科研数据。
【技术特征摘要】
1.一种面向知识服务的科研数据处理和预测性分析平台,其特征在于包括:数据处理模块:以国际主流的文摘数据库特定格式接收数据,将不同来源数据库的对应字段、著录规则、存储要求进行统一,将不同来源数据库转化为本平台所需要的数据,对数据进行规范提取,进行异常数据的识别和筛选,将异常数据提取出来以便人工识别,对错误数据重新识别提取;将处理后的数据进行去重处理,并进行MD5加密,规范后数据可通过ES索引实现对数据分析、查询操作;数据分析模块:用于获取规范后的数据、建立数据分析模型、从关系模型中抽取数据并以可视化视图展示出来;平台应用模块:用于将数据处理模块以及数据分析模块的结果提供给WEB应用程序,以便用户查询、浏览、统计科研数据。2.根据权利要求1所述的面向知识...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:湖南纬度信息科技有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。