用于大数据处理的数据挖掘方法技术

技术编号：11252524 阅读：135 留言：0更新日期：2015-04-02 01:40

本发明专利技术涉及互联网技术领域，具体地说是一种挖掘结果全面、数据处理速度高的用于大数据处理的数据挖掘方法，包括以下步骤：获取用户的检索需求，将其处理为一致性数据后，将其与预先存储的购买词进行相关性匹配，获得预先存储的购买词与检索需求数据之间至少一个相关性数据源，构建网络拓扑图，并在数据库中基于网络拓扑图进行挖掘，本发明专利技术与现有技术相比，摒弃了简单文字匹配或语义挖掘的方式，从相关性拓普网络入手，对待分析数据进行潜在关键信息的挖掘，具有所获结果更全面、更准确等显著的优点。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术涉及互联网
，具体地说是一种挖掘结果全面、数据处理速度高的，包括以下步骤：获取用户的检索需求，将其处理为一致性数据后，将其与预先存储的购买词进行相关性匹配，获得预先存储的购买词与检索需求数据之间至少一个相关性数据源，构建网络拓扑图，并在数据库中基于网络拓扑图进行挖掘，本专利技术与现有技术相比，摒弃了简单文字匹配或语义挖掘的方式，从相关性拓普网络入手，对待分析数据进行潜在关键信息的挖掘，具有所获结果更全面、更准确等显著的优点。【专利说明】
: 本专利技术涉及互联网
，具体地说是一种挖掘结果全面、数据处理速度高的。
技术介绍
: 大数据技术或称巨量资料，指的是所涉及的资料量规模巨大到无法通过目前主流软件工具，在合理的时间内达到汲取、管理、处理并整理成为帮助企业经营决策更积极目的资讯。大数据计数的战略意义不在于掌握庞大的数据信息，而在于对这些含有意义的数据进行专业化的处理，换言之，如果把大数据比作一种产业，那么这种产业实现盈利的关键在于提高对数据的“加工能力”，通过加工数据实现增值。如何从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、事先不知道的、但有时潜在有用的信息的过程被称为数据挖掘，显而易见，数据挖掘时大数据技术的关键。目前常见的数据挖掘方法大致分为以下几种:一种通过半自动化的方式建立网页分类体系，并引入数据分类、查询词分类或购买分类等属性，结合网页搜索结果进行相关性反馈，从而得到想要的信息；另一种是基于字面的文字匹配；还有一种是采用基于语义，分析潜在语义相关性模...

【技术保护点】
一种用于大数据处理的数据挖掘方法，其特征在于包括以下步骤：步骤1：获取用户的检索需求，通过用户输入检索词或语音的方式，获知用户的需求；步骤2：对步骤1中所获的数据进行初步处理，将其处理为一致性数据后存入存储器准备下一步处理；步骤3：从存储器中提取经过预处理后的检索需求数据，将其与预先存储的购买词进行相关性匹配，获得预先存储的购买词与检索需求数据之间至少一个相关性数据源；步骤4：对步骤3所获的相关性数据构建网络拓扑图，并在数据库中基于网络拓扑图进行挖掘；步骤5：输出挖掘结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：赵迪，高辉，
申请(专利权)人：芜湖乐锐思信息咨询有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人