海量信息的评级方法、设备以及系统技术方案

技术编号:16819187 阅读:46 留言:0更新日期:2017-12-16 12:39
本发明专利技术提供了一种海量信息的评级方法、设备以及系统,涉及数据处理技术领域。所述方法包括获取待评级的海量信息;根据预先设定的标志位对所述海量信息进行数据清洗;对数据清洗后的海量信息计算特征值、置信区间、平滑度以及异常点聚集度;根据计算结果确定出所述海量信息的评级结果。本发明专利技术运用了各类数学统计工具,对数据进行综合计算,并量化分析结果,完成信息的自动化评级,最终实现有效的针对海量数据进行自动化评级,评级得分较高的信息将更加具有分析价值。

Rating methods, equipment and systems for massive information

The present invention provides a rating method, equipment and system for massive information, which relates to the field of data processing technology. The method includes obtaining huge amounts of information to be rated according to a preset position; sign data cleaning of the vast amounts of information; the massive information data cleaning after calculating the eigenvalue, confidence interval, smoothness and abnormal aggregation; according to the calculated results, the mass information rating results. The invention uses the tools of all types of mathematical statistics, a comprehensive calculation of the data, and the result of the quantitative analysis, automatic rating information, finally realize the effective mass data automatic rating, rating scores will have more information value analysis.

【技术实现步骤摘要】
海量信息的评级方法、设备以及系统
本专利技术关于数据处理
,特别是关于海量数据的分析挖掘技术,具体的讲是一种海量信息的评级方法、海量信息的评级设备、海量信息的评级系统、计算机设备以及计算机可读存储介质。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。在信息化时代的高速发展下,各企业的数据信息急剧膨胀。因此,如何对海量数据进行利用成为一个十分重要的课题,诸如如何准确高效的从丰富而膨胀的海量数据中筛选出对企业风险评估、经营决策等有指导意义的信息。但是,由于企业的数据信息量极大,人为对数据进行分析已经无法满足数据量的急剧膨胀。目前,一般对全量的数据进行数据挖掘分析,或者根据一定的区间或其它属性选择一个子集来进行数据挖掘分析。对全量数据进行挖掘分析需要消耗大量的资源与时间,而对一个数据子集进行数据挖掘分析必定不能得到全面的有价值信息或分析获得的信息准确性有偏差。因此,如何提供一种新的方案,其能够解决上述技术问题是本领域亟待解决的技术难题。
技术实现思路
有鉴于此,本专利技术提供了一种海量信息的评级方法、海量信息本文档来自技高网...
海量信息的评级方法、设备以及系统

【技术保护点】
一种海量信息的评级方法,其特征是,所述方法包括:获取待评级的海量信息;根据预先设定的标志位对所述海量信息进行数据清洗;对数据清洗后的海量信息计算特征值、置信区间、平滑度以及异常点聚集度;根据计算结果确定出所述海量信息的评级结果。

【技术特征摘要】
1.一种海量信息的评级方法,其特征是,所述方法包括:获取待评级的海量信息;根据预先设定的标志位对所述海量信息进行数据清洗;对数据清洗后的海量信息计算特征值、置信区间、平滑度以及异常点聚集度;根据计算结果确定出所述海量信息的评级结果。2.根据权利要求1所述的方法,其特征是,所述标志位为数据特征的阈值集合,根据预先设定的标志位对所述海量信息进行数据清洗包括:根据所述数据特征的阈值集合对所述海量信息中的数据行进行判断,筛选出满足所述阈值集合的信息,形成数据清洗后的海量信息。3.根据权利要求2所述的方法,其特征是,对数据清洗后的海量信息计算特征值、置信区间、平滑度以及异常点聚集度包括:对数据清洗后的海量信息中缺失时刻的值补零;对数据清洗后的海量信息中的报警信息从值域维度进行标准化预处理;计算所述海量信息的特征值,所述特征值包括极值、期望值以及标准差;计算所述海量信息中报警信息的置信区间;利用一阶震荡能量泛函计算所述海量信息的平滑度;计算置信区间之外的所述海量信息中异常点的聚集度。4.根据权利要求3所述的方法,其特征是,根据计算结果确定出所述海量信息的评级结果包括:分别对所述特征值、置信区间、平滑度以及聚集度进行信息评级,输出所述海量信息的评级结果。5.根据权利要求4所述的方法,其特征是,所述方法还包括:展示所述海量信息的评级结果;存储所述评级结果以及所述海量信息。6.一种海量信息的评级设备,其特征是,所述设备包括:信息获取装置,用于获取待评级的海量信息;信息清洗装置,用于根据预先设定的标志位对所述海量信息进行数据清洗;信息计算装置,用于对数据清洗后的海量信息计算...

【专利技术属性】
技术研发人员:葛峥张伟礼韩旭
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1