【技术实现步骤摘要】
本专利技术涉及计算机数据挖掘技术的领域,尤其是涉及基于大数据的计算机数据挖掘探索方法。
技术介绍
近年来,随着数据采集和存储等技术的发展,信息社会的数据呈现了爆棚式增长,出现了“数据丰富,信息贫乏”的局面。海量数据不仅使得人们难以分辨出有用的数据,更大大增加了数据分析工作的复杂程度。为了解决这个问题,数据挖掘技术应运而生。数据挖掘的诞生,旨在将社会上存在的可以广泛使用的大量数据,转换成有用的知识和信息,应用于市场分析、欺诈监测、顾客保有、产品控制和科学探索等。在实际应用中,数据挖掘任务繁多,但通常可以分为两类:预测和播述。它涉及多个学科,比如机器学习、数理统计、棋式识别、信号处理、数据库等等,数据挖掘作为一口面向应用的技术,传统的数据挖掘算法不能适用于所有应用场景。因为在实际应用中,数据库中的数据往往不是十分理想,比如非平衡数据、多分类数据、时间序列和数据流等。虽然近年来,数据挖掘技术在理论和实际应用中都取得了丰硕的成果,但由于实际工程中数据复杂、挖掘任务多样,仍有许多具有挑战性的课题亟待解决,基于大数据的挖掘就是其中一个重要问题,其运算速度和精度等都有待于进一步提高。
技术实现思路
本专利技术的目的是克服现有技术中存在的上述缺陷,提供一种基于大数据的计算机数据挖掘探索方法,使其能有效地处理海量数据,提高数据挖掘的运算速度和精度,能有效提取所需的探索兴趣特征数据。为了实现上述目 ...
【技术保护点】
基于大数据的计算机数据挖掘探索方法,其特征在于,该方法包括以下步骤:步骤1:输入给定的大数据样本集X,其中X={X1,X2,…,Xn};步骤2:对输入样本集进行去噪、归一化处理;步骤3:选取m值和W=(W1,W2,…Wm)分别作为均值聚类算法的生成簇个数和初始质的参数;步骤4:执行均值聚类算法,得到m个簇{M1,M2,…,Mm};步骤5:将这m个簇的每个Mi作为初始簇的子簇;步骤6:计算特征向量Y,其特征向量Y表示为:Y=(Y1,Y2,...,Ym);步骤7:设定探索兴趣参数d,当Yi<d,则输出兴趣特征Yi,否则不做处理。
【技术特征摘要】
1.基于大数据的计算机数据挖掘探索方法,其特征在于,该方法包括以下步骤:...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。