当前位置: 首页 > 专利查询>石永丽专利>正文

基于大数据的计算机数据挖掘探索方法技术

技术编号:15045908 阅读:104 留言:0更新日期:2017-04-05 18:08
本发明专利技术公开了基于大数据的计算机数据挖掘探索方法,该计算机数据挖掘探索方法通过对输入样本集进行去噪、归一化处理,然后选取生成簇个数和初始质的参数执行均值聚类算法,并将计算结果作为初始簇的子簇,再计算特征向量,最后设定探索兴趣参数与兴趣特征做比较,从而输出兴趣特征数据。该方法能有效地处理海量数据,提高数据挖掘的运算速度和精度,能有效提取所需的探索兴趣特征数据。

【技术实现步骤摘要】

本专利技术涉及计算机数据挖掘技术的领域,尤其是涉及基于大数据的计算机数据挖掘探索方法
技术介绍
近年来,随着数据采集和存储等技术的发展,信息社会的数据呈现了爆棚式增长,出现了“数据丰富,信息贫乏”的局面。海量数据不仅使得人们难以分辨出有用的数据,更大大增加了数据分析工作的复杂程度。为了解决这个问题,数据挖掘技术应运而生。数据挖掘的诞生,旨在将社会上存在的可以广泛使用的大量数据,转换成有用的知识和信息,应用于市场分析、欺诈监测、顾客保有、产品控制和科学探索等。在实际应用中,数据挖掘任务繁多,但通常可以分为两类:预测和播述。它涉及多个学科,比如机器学习、数理统计、棋式识别、信号处理、数据库等等,数据挖掘作为一口面向应用的技术,传统的数据挖掘算法不能适用于所有应用场景。因为在实际应用中,数据库中的数据往往不是十分理想,比如非平衡数据、多分类数据、时间序列和数据流等。虽然近年来,数据挖掘技术在理论和实际应用中都取得了丰硕的成果,但由于实际工程中数据复杂、挖掘任务多样,仍有许多具有挑战性的课题亟待解决,基于大数据的挖掘就是其中一个重要问题,其运算速度和精度等都有待于进一步提高。
技术实现思路
本专利技术的目的是克服现有技术中存在的上述缺陷,提供一种基于大数据的计算机数据挖掘探索方法,使其能有效地处理海量数据,提高数据挖掘的运算速度和精度,能有效提取所需的探索兴趣特征数据。为了实现上述目的,本专利技术提供了一种基于大数据的计算机数据挖掘探索方法,该方法包括如下步骤:步骤1:输入给定的大数据样本集X,其中X={X1,X2,···,Xn本文档来自技高网...

【技术保护点】
基于大数据的计算机数据挖掘探索方法,其特征在于,该方法包括以下步骤:步骤1:输入给定的大数据样本集X,其中X={X1,X2,…,Xn};步骤2:对输入样本集进行去噪、归一化处理;步骤3:选取m值和W=(W1,W2,…Wm)分别作为均值聚类算法的生成簇个数和初始质的参数;步骤4:执行均值聚类算法,得到m个簇{M1,M2,…,Mm};步骤5:将这m个簇的每个Mi作为初始簇的子簇;步骤6:计算特征向量Y,其特征向量Y表示为:Y=(Y1,Y2,...,Ym);步骤7:设定探索兴趣参数d,当Yi<d,则输出兴趣特征Yi,否则不做处理。

【技术特征摘要】
1.基于大数据的计算机数据挖掘探索方法,其特征在于,该方法包括以下步骤:...

【专利技术属性】
技术研发人员:蒋雪峰蒋顺恺石永丽
申请(专利权)人:石永丽
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1