一种面向云计算的可视化数据挖掘系统及其架构方法技术方案

技术编号:21913976 阅读:29 留言:0更新日期:2019-08-21 12:26
本发明专利技术公开了一种面向云计算的可视化数据挖掘系统架构方法,包括如下步骤:统计用户的基本信息;数据源处理和挖掘,将所有数据源根据信息类别划分到数据库的独立单元,并对单个数据库中的数据源预处理和校准集成;利用挖掘引擎单元循环提取数据库中对应关联的信息数据源,增添对数据源提取的活动修改调整单元,关联数据挖掘的方向和信息类型;根据用户浏览日志和发布的数据,利用活动修改调整单元结果通过可视化的知识表示技术展示给用户;数据挖掘系统包括用户认证单元、数据源采集单元、数据源预处理单元、挖掘引擎单元、活动修改调整单元、页面临时存储单元和用户浏览日志;提取有效信息,避免在多次挖掘之后造成信息单一化。

A Visual Data Mining System for Cloud Computing and Its Architecture

【技术实现步骤摘要】
一种面向云计算的可视化数据挖掘系统及其架构方法
本专利技术实施例涉及数据挖掘系统
,具体涉及一种面向云计算的可视化数据挖掘系统及其架构方法。
技术介绍
互联网、大数据和云计算等信息技术的飞速发展使人类社会进入信息时代,人们经常通过网络来访问和接受各种各样的数据信息。面对这些鱼龙混杂的海量数据和个人对数据的不同需求,使得从海量数据中提取和挖掘有用信息显得非常重要,于是出现了数据挖掘技术。数据挖掘能够处理信息庞大、数据模糊和组成结构相对复杂的数据,应用范围较广。网络技术能为人们提供大量的信息,但它也使人们从海量数据中提取有用信息的难度越来越大,这就必须加快数据挖据技术的发展。因此,云计算技术应运而生,它的出现和发展给数据挖掘造成了技术瓶颈,但也为数据挖掘和云计算有效结合的新模式创造了发展机遇。然而现有的云计算数据挖掘系统还存在如下缺陷:(1)大多根据用户的信息类型和用户浏览日志,分析用户关注的信息类别,然后根据浏览记录实时挖掘相关数据信息,导致在多次数据挖掘处理后,显示给用户的信息单一,影响信息的多样化,因此影响使用体验;(2)数据在编辑时没有归类,导致数据挖掘系统的维度大,挖掘难度大,影响数据挖掘的及时性。
技术实现思路
为此,本专利技术实施例提供一种面向云计算的可视化数据挖掘系统及其架构方法,采用使用多种数据挖掘模式,将用户根据信息类别分类,数据源进行信息类别聚类,挖掘数据源中匹配用户个体的数据进行展示,同时利用全方位信息关联模式,推断和挖掘数据源中的信息进行展示,既能保证从爆炸信息中提取有效信息,同时还向用户提供不同类型的信息,避免在多次挖掘之后造成信息单一化,以解决现有技术中的问题。为了实现上述目的,本专利技术的实施方式提供如下技术方案:一种面向云计算的可视化数据挖掘系统的架构方法,包括如下步骤:步骤100、定位用户位置,统计用户的基本信息,标记存储用户关注的数据信息类型,同时保存每个用户发布的信息数据源;步骤200、数据源处理和挖掘,将所有数据源依据不同信息类别逐步划分到对应范围的数据库中,提取数据源中的关键字进行数据源校准集成;步骤300、模式评估,利用挖掘引擎单元确定用户关注的信息类型,保存用户浏览日志,分析用户已发布的数据,循环提取数据库中对应关联的信息数据源,增添对数据源提取的活动修改调整单元,关联数据挖掘的方向和信息类型;步骤400、知识表示,将挖掘引擎单元和活动修改调整单元的最终的挖掘结果,通过可视化的知识表示技术展示给用户。作为本专利技术的一种优选方案,在步骤200中,还包括利用云计算平台采集用户发布的数据源,用户编辑数据源的具体步骤为:先选择数据源所属的信息类别,将数据源对应系统信息类别进行一级分类;对于有二级分类的系统项目,进行二次分级选类;依次类推,直至分类到信息类别下的最小单元。作为本专利技术的一种优选方案,在步骤200中,将数据源划分到不同范围数据库的具体步骤为:步骤201、采集每个用户发布的数据源,根据用户注册的固定基本位置信息,将数据源匹配到对应位置的数据库中;步骤202、提取数据源中的信息类别对应的最小单元,将数据源匹配保存到独立单元对应的数据库中;步骤203、对数据源进行分段,标记数据源在每个信息类别分级的关键字;步骤204、收集并且显示每条数据源的参与人数,共享不同数据库的数据源。作为本专利技术的一种优选方案,在步骤300中,利用挖掘引擎单元关联信息数据源的具体操作为:步骤301、根据设定时间段内的若干条用户浏览痕迹生成用户浏览日志,实时统计用户分别浏览相同信息类别的次数;步骤302、根据相同信息类别的浏览次数大小顺序,按照正比例关系挖掘数据库中对应信息类别的数据源;步骤303、根据时间顺序统计用户发布的数据源,统计不同信息类别的数据源个数,判断用户关注的信息类别,按照正比例关系挖掘数据库中对应信息类别的数据源;步骤304、根据时间顺序提取用户发布数据源的关键字,根据关键字挖掘数据库中对应时间顺序的数据源。作为本专利技术的一种优选方案,在步骤300中,利用活动修改调整单元进行数据挖掘的具体步骤为:活动修改调整单元判断参与人数多的数据源是否为有效数据;将无效数据源发送到数据库,数据库定期自动删除无效的数据源;活动修改调整单元提取若干参与人数多的有效数据源;将参与人数多的有效数据源与挖掘到的数据源交叉式展示给用户。作为本专利技术的一种优选方案,在步骤300中,还包括对活动修改调整单元和挖掘引擎单元各自挖掘的数据源进行数量分比,活动修改调整单元:挖掘引擎单元=2:8。作为本专利技术的一种优选方案,步骤400还包括页面浏览清空单元,在用户退出浏览时,所述页面浏览清空单元将浏览痕迹挖掘信息清空。本专利技术还提供一种面向云计算的可视化数据挖掘系统,包括:用户认证单元,统计用户的基本信息,标记存储用户关注的数据信息类型;数据源采集单元,用于采集每个用户发布提交的数据源,并且在采集时对数据进行一次认证,自动屏蔽不良信息,提高安全性能;数据源预处理单元,研究数据源质量,提取数据源关键字,提高数据源的可挖掘等级,聚集相同信息类别的数据源个数,并且将所有数据源按照不同信息类别划分到对应数据库独立单元中;挖掘引擎单元确定用户关注的信息类型,保存用户浏览日志,分析用户已发布的数据,循环提取数据库中对应关联的信息数据源;活动修改调整单元,将挖掘引擎单元关联的数据挖掘信息类型,交叉式分布不同信息类型的数据源。作为本专利技术的一种优选方案,还包括显示页面临时存储单元,所述显示页面临时存储单元当前浏览状态下挖掘的数据源,当退出浏览时,则将显示页面临时存储单元内的数据清除,重新利用挖掘引擎单元显示挖掘的数据源。作为本专利技术的一种优选方案,还包括用户浏览日志,保存设定时间段内的若干条用户浏览痕迹,并且将浏览记录可根据不同信息类别或者不同日期显示。本专利技术的实施方式具有如下优点:(1)本专利技术通过规范用户编辑数据源,将数据源保存在对应匹配的数据库中,并且标记每条数据源内的关键字,从而降低数据挖掘系统的提取难度,减弱挖掘的步骤;(2)本专利技术使用多种数据挖掘模式,将用户根据信息类别分类,数据源进行信息类别聚类,挖掘数据源中匹配用户个体的数据进行展示,同时利用全方位信息关联模式,推断和挖掘数据源中的信息进行展示,既能保证从爆炸信息中提取有效信息,同时还向用户提供不同类型的信息,避免在多次挖掘之后造成信息单一化。附图说明为了更清楚地说明本专利技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本专利技术可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本专利技术所能产生的功效及所能达成的目的下,均应仍落在本专利技术所揭示的
技术实现思路
得能涵盖的范围内。图1为本专利技术实施方式中系统架构方法的流程示意图;图2为本专利技术实施方式中的数据挖掘系统结构框图。具体实施方式以下由特定的具体实施例说明本专利技术的实施方式,熟悉此技术的人士可由本本文档来自技高网
...

【技术保护点】
1.一种面向云计算的可视化数据挖掘系统的架构方法,其特征在于,包括如下步骤:步骤100、定位用户位置,统计用户的基本信息,标记存储用户关注的数据信息类型,同时保存每个用户发布的信息数据源;步骤200、数据源处理和挖掘,将所有数据源依据不同信息类别逐步划分到对应范围的数据库中,提取数据源中的关键字进行数据源校准集成;步骤300、模式评估,利用挖掘引擎单元确定用户关注的信息类型,保存用户浏览日志,分析用户已发布的数据,循环提取数据库中对应关联的信息数据源,增添对数据源提取的活动修改调整单元,关联数据挖掘的方向和信息类型;步骤400、知识表示,将挖掘引擎单元和活动修改调整单元的最终的挖掘结果,通过可视化的知识表示技术展示给用户。

【技术特征摘要】
1.一种面向云计算的可视化数据挖掘系统的架构方法,其特征在于,包括如下步骤:步骤100、定位用户位置,统计用户的基本信息,标记存储用户关注的数据信息类型,同时保存每个用户发布的信息数据源;步骤200、数据源处理和挖掘,将所有数据源依据不同信息类别逐步划分到对应范围的数据库中,提取数据源中的关键字进行数据源校准集成;步骤300、模式评估,利用挖掘引擎单元确定用户关注的信息类型,保存用户浏览日志,分析用户已发布的数据,循环提取数据库中对应关联的信息数据源,增添对数据源提取的活动修改调整单元,关联数据挖掘的方向和信息类型;步骤400、知识表示,将挖掘引擎单元和活动修改调整单元的最终的挖掘结果,通过可视化的知识表示技术展示给用户。2.根据权利要求1所述的一种面向云计算的可视化数据挖掘系统的架构方法,其特征在于,在步骤200中,还包括利用云计算平台采集用户编辑发布的数据源,用户编辑数据源的具体步骤为:先选择数据源所属的信息类别,将数据源对应系统信息类别进行一级分类;对于有二级分类的系统项目,进行二次分级选类;依次类推,直至分类到信息类别下的最小单元。3.根据权利要求1所述的一种面向云计算的可视化数据挖掘系统的架构方法,其特征在于,在步骤200中,将数据源划分到不同范围数据库的具体步骤为:步骤201、采集每个用户发布的数据源,根据用户注册的固定基本位置信息,将数据源匹配到对应位置的数据库中;步骤202、提取数据源中的信息类别对应的最小单元,将数据源匹配保存到独立单元对应的数据库中;步骤203、对数据源进行分段,标记数据源在每个信息类别分级的关键字;步骤204、收集并且显示每条数据源的参与人数,共享不同数据库的数据源。4.根据权利要求1所述的一种面向云计算的可视化数据挖掘系统的架构方法,其特征在于,在步骤300中,利用挖掘引擎单元关联信息数据源的具体操作包括:步骤301、根据设定时间段内的若干条用户浏览痕迹生成用户浏览日志,实时统计用户分别浏览相同信息类别的次数;步骤302、根据相同信息类别的浏览次数大小顺序,按照正比例关系挖掘数据库中对应信息类别的数据源;步骤303、根据时间顺序统计用户发布的数据源,统计不同信息类别的数据源个数,判断用户关注的信息类别,按照正比例关系挖掘数据库中对应...

【专利技术属性】
技术研发人员:陈强
申请(专利权)人:深圳市城市屋超科技有限公司
类型:发明
国别省市:广东,44

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1