数据挖掘方法及装置制造方法及图纸

技术编号:15103914 阅读:83 留言:0更新日期:2017-04-08 14:20
本发明专利技术实施例提供一种数据挖掘方法及装置。该方法包括:确定待处理的目标数据;依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;显示所述第一处理结果和/或第二处理结果,以供用户选择。本发明专利技术实施例通过至少两种数据挖掘算法分别对目标数据进行数据处理,获取到至少两个处理结果,并且将第一次处理的结果作为第二次处理的输入数据,形成循环的数据处理过程,相比于属于特定数据类型的目标数据只能依据固定的数据挖掘算法进行处理,增强了数据挖掘对目标数据进行数据处理的灵活性。

【技术实现步骤摘要】

本专利技术实施例涉及数据分析技术,尤其涉及一种数据挖掘方法及装置
技术介绍
数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系的信息过程,包括数据准备、关系寻找和结果显示三个步骤。现有的数据挖掘过程具体为确定待处理的目标数据,依据目标数据的数据类型确定数据挖掘算法,依据数据挖掘算法对目标数据进行计算处理,具体可以为寻找目标数据中的关联关系,将确定的关联关系进行结果显示。由于属于特定数据类型的目标数据只能依据固定的数据挖掘算法进行处理,导致数据挖掘对目标数据进行数据处理的灵活性较低。
技术实现思路
本专利技术实施例提供一种数据挖掘方法及装置,以提高数据挖掘对目标数据进行数据处理的灵活性。本专利技术实施例的一个方面是提供一种数据挖掘方法,包括:确定待处理的目标数据;依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;显示所述第一处理结果和/或第二处理结果,以供用户选择。本专利技术实施例的另一个方面是提供一种数据挖掘装置,包括:目标数据确定模块,用于确定待处理的目标数据;数据处理模块,用于依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;显示模块,用于显示所述第一处理结果和/或第二处理结果,以供用户选择。本专利技术实施例提供的数据挖掘方法及装置,通过至少两种数据挖掘算法分别对目标数据进行数据处理,获取到至少两个处理结果,并且将第一次处理的结果作为第二次处理的输入数据,形成循环的数据处理过程,相比于属于特定数据类型的目标数据只能依据固定的数据挖掘算法进行处理,增强了数据挖掘对目标数据进行数据处理的灵活性。附图说明图1为本专利技术实施例提供的数据挖掘方法流程图;图2为本专利技术实施例提供的数据挖掘装置的结构图;图3为本专利技术另一实施例提供的数据挖掘装置的结构图。具体实施方式图1为本专利技术实施例提供的数据挖掘方法流程图。本专利技术实施例针对数据挖掘对目标数据进行数据处理的灵活性低的问题,提出了一种新的数据挖掘方法,该方法的具体步骤如下:步骤S101、确定待处理的目标数据;所述确定待处理的目标数据包括:将多个文件和/或多个数据库中的数据进行合并;对合并后的数据进行数据选择获得数据集合;从所述数据集合中选择出适用于所述至少两种数据挖掘算法进行处理的所述目标数据。利用数据挖掘算法进行数据处理之前,先要确定待处理的目标数据,具体地将多个文件和/或多个数据库中的数据进行合并,以便获取到足够多的数据,从足够多的数据中依据数据处理的需求进行数据选择获得数据集合,再依据预定的至少两种数据挖掘算法从该数据集合中选择出适用于数据挖掘的目标数据。步骤S102、依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;确定出目标数据后,依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,每一种数据挖掘算法对目标数据进行处理后将获得一个处理结果,则经过至少两种数据挖掘算法进行处理将至少获得两个处理结果即第一处理结果。步骤S103、将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;返回到步骤S101,将获得的第一处理结果再次作为所述目标数据,继续执行步骤S102,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果。即数据挖掘的处理结果还可以作为数据挖掘的输入数据进行再次数据处理,形成循环的数据处理。步骤S104、显示所述第一处理结果和/或第二处理结果,以供用户选择。将所述第一处理结果和/或第二处理结果进行显示,即循环的数据处理结果可以直接输入供用户选择,也可以不输出进行后续的循环处理。本专利技术实施例不限制循环处理的次数,且数据挖掘算法至少包括:决策树、关联规则、贝叶斯、神经网络、规则学习、遗传算法、粗糙集和模糊逻辑。本专利技术实施例通过至少两种数据挖掘算法分别对目标数据进行数据处理,获取到至少两个处理结果,并且将第一次处理的结果作为第二次处理的输入数据,形成循环的数据处理过程,相比于属于特定数据类型的目标数据只能依据固定的数据挖掘算法进行处理,增强了数据挖掘对目标数据进行数据处理的灵活性。在上述实施例的基础上,所述依据至少两种数据挖掘算法分别对所述目标数据进行数据处理包括:依据所述至少两种数据挖掘算法和初始优先级分别对所述目标数据进行数据处理,所述初始优先级是依据所述目标数据对应的数据类型与所述数据挖掘算法的适用度确定的。本专利技术实施例预定有三种数据挖掘算法分别为A算法、B算法、C算法,所述A算法、B算法、C算法可以分别由不同的服务器执行,也可以由同一个服务器同时运行,在初始条件下,A算法、B算法、C算法对不同类型的数据进行处理的优先级不同,假设对同一类目标数据,A算法、B算法、C算法对应的优先级分别是高、中、低。当该类型的目标数据输入到服务器后,通过A算法、B算法、C算法依次对目标数据进行处理,合理假设通过A算法、B算法、C算法对目标数据的处理速度相同,则通过A算法对目标数据进行处理的结果a将最先显示,其次是通过B算法对目标数据进行处理的结果b,最后显示通过C算法对目标数据进行处理的结果c。所述显示所述第一处理结果之后,还包括:获取用户对所述第一处理结果的反馈信息,依据所述反馈信息调整所述目标数据对应的数据类型与所述数据挖掘算法的适用度。第一处理结果包括结果a、结果b和结果c,且结果a、结果b和结果c先后显示。用户对结果a、结果b和结果c的点击率以及满意度都不同,该点击率以及满意度均可以作为反馈信息,在本专利技术实施例中,除了执行数据挖掘算法的服务器外,还有一个起到调度作用的调度服务器,该调度服务器用于记录用户对处理结果的反馈信息,具体记录处理结果、反馈信息、数据挖掘算法和数据类型的对应关系。如果反馈信息表示用户对处理结果的点击率超出了阈值,或用户对处理结果的平均评分超出了阈值,则说明该数据类型适用于依据该数据挖掘算法进行数据处理,即该数据类型与该数据挖掘算法的适用度本文档来自技高网...

【技术保护点】
一种数据挖掘方法,其特征在于,包括:确定待处理的目标数据;依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获得第一处理结果;将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算法分别对所述第一处理结果进行数据处理,获得第二处理结果;显示所述第一处理结果和/或第二处理结果,以供用户选择。

【技术特征摘要】
1.一种数据挖掘方法,其特征在于,包括:
确定待处理的目标数据;
依据至少两种数据挖掘算法分别对所述目标数据进行数据处理,分别获
得第一处理结果;
将所述第一处理结果作为所述目标数据,依据所述至少两种数据挖掘算
法分别对所述第一处理结果进行数据处理,获得第二处理结果;
显示所述第一处理结果和/或第二处理结果,以供用户选择。
2.根据权利要求1所述的方法,其特征在于,所述依据至少两种数据挖
掘算法分别对所述目标数据进行数据处理包括:
依据所述至少两种数据挖掘算法和初始优先级分别对所述目标数据进行
数据处理,所述初始优先级是依据所述目标数据对应的数据类型与所述数据
挖掘算法的适用度确定的。
3.根据权利要求2所述的方法,其特征在于,所述显示所述第一处理结
果之后,还包括:
获取用户对所述第一处理结果的反馈信息,依据所述反馈信息调整所述
目标数据对应的数据类型与所述数据挖掘算法的适用度。
4.根据权利要求3所述的方法,其特征在于,所述至少两种数据挖掘算
法包括第一数据挖掘算法和第二数据挖掘算法;
所述依据至少两种数据挖掘算法分别对所述目标数据进行数据处理包
括:
依据所述第一数据挖掘算法对所述目标数据进行数据处理获得中间处理
结果;
依据所述第二数据挖掘算法对所述中间处理结果进行数据处理获得所述
第一处理结果。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述确定待处理
的目标数据包括:
将多个文件和/或多个数据库中的数据进行合并;
对合并后的数据进行数据选择获得数据集合;
从所述数据集合中选择出适用于所述至少两种数据挖掘算法进行处理的

\t所述目标数据。
6.一...

【专利技术属性】
技术研发人员:刘阳
申请(专利权)人:北大方正集团有限公司北京北大方正电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1