【技术实现步骤摘要】
一种基于大数据的计算机数据挖掘探索方法及系统
本专利技术涉及计算机数据挖掘
,具体为一种基于大数据的计算机数据挖掘探索方法及系统。
技术介绍
对于大数据,往往不能直接读取其中隐含的信息,也不容易从大量的信息中看出某个事物的发展趋势;这样数据挖掘就应运而生,数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。虽然近年来,数据挖掘技术在理论和实际应用中都取得了丰硕的成果,但由于实际工程中数据复杂、挖掘任务多样,仍有许多具有挑战性的课题亟待解决,基于大数据的挖掘就是其中一个重要问题,其运算速度和精度等都有待于进一步提高。因此,我们推出了一种基于大数据的计算机数据挖掘探索方法。
技术实现思路
本 ...
【技术保护点】
1.一种基于大数据的计算机数据挖掘探索方法,采用挖掘探索设备,包括以下步骤:/nS1:采集计算机数据,形成原始大数据;/nS2:对原始大数据进行预处理后,存入数据仓库形成原始大数据库;/nS3:采用Web数据挖掘工具、线性回归分析和关联规则建立深度集成行为树模型,并利用该模型对原始大数据库进行数据挖掘,得到挖掘数据;/nS4:利用服务器向目标客户群的终端发放调查问卷,采集目标客户的意见和需求信息,得到客户数据;/nS5:利用快速聚类分析法处理目标客户信息和客户数据,并从中提取出相关的技术特征;/nS6:对比该技术特征,在上述的得到的挖掘数据中进行对比分析处理剔除不符合的数据 ...
【技术特征摘要】
1.一种基于大数据的计算机数据挖掘探索方法,采用挖掘探索设备,包括以下步骤:
S1:采集计算机数据,形成原始大数据;
S2:对原始大数据进行预处理后,存入数据仓库形成原始大数据库;
S3:采用Web数据挖掘工具、线性回归分析和关联规则建立深度集成行为树模型,并利用该模型对原始大数据库进行数据挖掘,得到挖掘数据;
S4:利用服务器向目标客户群的终端发放调查问卷,采集目标客户的意见和需求信息,得到客户数据;
S5:利用快速聚类分析法处理目标客户信息和客户数据,并从中提取出相关的技术特征;
S6:对比该技术特征,在上述的得到的挖掘数据中进行对比分析处理剔除不符合的数据;
S7:利用Adaboost迭代算法对上述筛选出来的挖掘数据进行探索分析,得到与原始大数据相关联的挖掘探索信息;
S8:输出最终数据信息。
2.如权利要求1所述的一种基于大数据的计算机数据挖掘探索方法,其特征在于:所述步骤S1具体为采用WEKA数据挖掘平台采集计算机数据,并形成计算机数据。
3.如权利要求1所述的一种基于大数据的计算机数据挖掘探索方法,其特征在于:所述步骤S2还包括以下步骤:
S201:数据清理,通过填写确实的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据;
S202:数据集成,将多个数据源中的数据结合起来并统一储存,建立数据仓库的过程实际上就是数据集成;
S203:数据变换,通过平滑聚集、数据概化、规范化等方式将数据转换成适合用于数据挖掘的形式;
S204:数据回归,用来得到数据集的归约表示,它小得多,但仍然接近于保持原数据的完整性,并结果与归约前结果形同或几乎相同。
4.如权利要求1所述的一种基于大数据的计算机数据挖掘探索方法,其...
【专利技术属性】
技术研发人员:陈庆,赵金霞,王世谦,易翔,
申请(专利权)人:东莞理工学院城市学院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。