一种面向云计算的可视化数据挖掘系统及其架构方法技术方案

技术编号：21913976 阅读：29 留言：0更新日期：2019-08-21 12:26

本发明专利技术公开了一种面向云计算的可视化数据挖掘系统架构方法，包括如下步骤：统计用户的基本信息；数据源处理和挖掘，将所有数据源根据信息类别划分到数据库的独立单元，并对单个数据库中的数据源预处理和校准集成；利用挖掘引擎单元循环提取数据库中对应关联的信息数据源，增添对数据源提取的活动修改调整单元，关联数据挖掘的方向和信息类型；根据用户浏览日志和发布的数据，利用活动修改调整单元结果通过可视化的知识表示技术展示给用户；数据挖掘系统包括用户认证单元、数据源采集单元、数据源预处理单元、挖掘引擎单元、活动修改调整单元、页面临时存储单元和用户浏览日志；提取有效信息，避免在多次挖掘之后造成信息单一化。

A Visual Data Mining System for Cloud Computing and Its Architecture

全部详细技术资料下载

【技术实现步骤摘要】
一种面向云计算的可视化数据挖掘系统及其架构方法
本专利技术实施例涉及数据挖掘系统
，具体涉及一种面向云计算的可视化数据挖掘系统及其架构方法。
技术介绍
互联网、大数据和云计算等信息技术的飞速发展使人类社会进入信息时代，人们经常通过网络来访问和接受各种各样的数据信息。面对这些鱼龙混杂的海量数据和个人对数据的不同需求，使得从海量数据中提取和挖掘有用信息显得非常重要，于是出现了数据挖掘技术。数据挖掘能够处理信息庞大、数据模糊和组成结构相对复杂的数据，应用范围较广。网络技术能为人们提供大量的信息，但它也使人们从海量数据中提取有用信息的难度越来越大，这就必须加快数据挖据技术的发展。因此，云计算技术应运而生，它的出现和发展给数据挖掘造成了技术瓶颈，但也为数据挖掘和云计算有效结合的新模式创造了发展机遇。然而现有的云计算数据挖掘系统还存在如下缺陷：(1)大多根据用户的信息类型和用户浏览日志，分析用户关注的信息类别，然后根据浏览记录实时挖掘相关数据信息，导致在多次数据挖掘处理后，显示给用户的信息单一，影响信息的多样化，因此影响使用体验；(2)数据在编辑时没有归类，导致数据挖掘系统的维度大，挖掘难度大，影响数据挖掘的及时性。
技术实现思路
为此，本专利技术实施例提供一种面向云计算的可视化数据挖掘系统及其架构方法，采用使用多种数据挖掘模式，将用户根据信息类别分类，数据源进行信息类别聚类，挖掘数据源中匹配用户个体的数据进行展示，同时利用全方位信息关联模式，推断和挖掘数据源中的信息进行展示，既能保证从爆炸信息中提取有效信息，同时还向用户提供不同类型的信息，避免在多次挖掘之后造成信...

【技术保护点】
1.一种面向云计算的可视化数据挖掘系统的架构方法，其特征在于，包括如下步骤：步骤100、定位用户位置，统计用户的基本信息，标记存储用户关注的数据信息类型，同时保存每个用户发布的信息数据源；步骤200、数据源处理和挖掘，将所有数据源依据不同信息类别逐步划分到对应范围的数据库中，提取数据源中的关键字进行数据源校准集成；步骤300、模式评估，利用挖掘引擎单元确定用户关注的信息类型，保存用户浏览日志，分析用户已发布的数据，循环提取数据库中对应关联的信息数据源，增添对数据源提取的活动修改调整单元，关联数据挖掘的方向和信息类型；步骤400、知识表示，将挖掘引擎单元和活动修改调整单元的最终的挖掘结果，通过可视化的知识表示技术展示给用户。

【技术特征摘要】
1.一种面向云计算的可视化数据挖掘系统的架构方法，其特征在于，包括如下步骤：步骤100、定位用户位置，统计用户的基本信息，标记存储用户关注的数据信息类型，同时保存每个用户发布的信息数据源；步骤200、数据源处理和挖掘，将所有数据源依据不同信息类别逐步划分到对应范围的数据库中，提取数据源中的关键字进行数据源校准集成；步骤300、模式评估，利用挖掘引擎单元确定用户关注的信息类型，保存用户浏览日志，分析用户已发布的数据，循环提取数据库中对应关联的信息数据源，增添对数据源提取的活动修改调整单元，关联数据挖掘的方向和信息类型；步骤400、知识表示，将挖掘引擎单元和活动修改调整单元的最终的挖掘结果，通过可视化的知识表示技术展示给用户。2.根据权利要求1所述的一种面向云计算的可视化数据挖掘系统的架构方法，其特征在于，在步骤200中，还包括利用云计算平台采集用户编辑发布的数据源，用户编辑数据源的具体步骤为：先选择数据源所属的信息类别，将数据源对应系统信息类别进行一级分类；对于有二级分类的系统项目，进行二次分级选类；依次类推，直至分类到信息类别下的最小单元。3.根据权利要求1所述的一种面向云计算的可视化数据挖掘系统的架构方法，其特征在于，在步骤200中，将数据源划分到不同范围数据库的具体步骤为：步骤201、采集每个用户发布的数据源，根据用户注册的固定基本位置信息，将数据源匹配到对应位置的数据库中；步骤202、提取数据源中的信息类别对应的最小单元，将数据源匹配保存到独立单元对应的数据库中；步骤203、对数据源进行分段，标记数据源在每个信息类别分级的关键字；步骤204、收集并且显示每条数据源的参与人数，共享不同数据库的数据源。4.根据权利要求1所述的一种面向云计算的可视化数据挖掘系统的架构方法，其特征在于，在步骤300中，利用挖掘引擎单元关联信息数据源的具体操作包括：步骤301、根据设定时间段内的若干条用户浏览痕迹生成用户浏览日志，实时统计用户分别浏览相同信息类别的次数；步骤302、根据相同信息类别的浏览次数大小顺序，按照正比例关系挖掘数据库中对应信息类别的数据源；步骤303、根据时间顺序统计用户发布的数据源，统计不同信息类别的数据源个数，判断用户关注的信息类别，按照正比例关系挖掘数据库中对应...

【专利技术属性】
技术研发人员：陈强，
申请(专利权)人：深圳市城市屋超科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人