一种物联网数据挖掘方法技术

技术编号:26690613 阅读:16 留言:0更新日期:2020-12-12 02:41
本发明专利技术公开了一种物联网数据挖掘方法,所述物联网数据挖掘方法步骤包括有分类、回顾分析、聚类、关联规则、特征、变化和偏差分析和Web页挖掘,所述该方法操作方式分为以下具体步骤。本发明专利技术所述的一种物联网数据挖掘方法,通过物联网采用多种方式挖掘后,便可对挖掘的数据进行分析处理步骤,处理时根据数据挖掘信息选取一个或多个优越的经营模式,并在此经过上述对应步骤多次验证该分析模式,然后选取数据相对稳定的作为评价预备数据,并将数据输入计算机进行虚拟模拟计算分析该经营模式,这样多次对网络挖掘数据的验证和分析可以使得数据更加趋于准确,并且对该网络数据进行相应的计算机模拟,使得可以更大化的规避经营风险。

【技术实现步骤摘要】
一种物联网数据挖掘方法
本专利技术涉及网络数据挖掘领域,特别涉及一种物联网数据挖掘方法。
技术介绍
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标,数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤,数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集,规律寻找是用某种方法将数据集所含的规律找出来,规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来;然而现有的物联网数据挖掘方法在使用时存在一定的弊端,在经过多种物联网数据挖掘方法得出的数据中各有不同,因此在选择优越的挖掘数据结果后,其数据没有得到多次验证,从而使得数据不具有较高的精准性。
技术实现思路
本专利技术的主要目的在于提供一种物联网数据挖掘方法,可以有效解决
技术介绍
中的问题。为实现上述目的,本专利技术采取的技术方案为:一种物联网数据挖掘方法,所述物联网数据挖掘方法步骤包括有分类、回顾分析、聚类、关联规则、特征、变化和偏差分析和Web页挖掘,所述该方法操作方式分为以下具体步骤:S1、分类:找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别,可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测,当前的市场营销中很重要的一个特点是强调客户细分,客户类别分析的功能也在于此,采用数据挖掘中的分类技术,可以将客户分成不同的类别。比如呼叫中心设计时可以分为:呼叫频繁的客户、偶然大量呼叫的客户、稳定呼叫的客户、其他,帮助呼叫中心寻找出这些不同种类客户之间的特征,这样的分类模型可以让用户了解不同行为类别客户的分布特征;S2、回归分析:反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系,其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系;S3、聚类分析:把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能的小;S4、关联规则:描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可到处另一些项在同一事物中也出现,即隐藏在数据间的关联或相互关系;S5、特征分析:从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的总体特征,特征选择的目的在于从海量数据中提取出有用信息,从而提高数据的使用效率,其中,特征有效性的选择评价有概率论、数理统计、信息论、IR领域的度量;S6、变化和偏差分析:偏差包括很大一类潜在有趣的知识,如分类中的反常实例,模式的例外,观察结果对期望的偏差等,其目的是寻找观察结果与参照量之间有意义的差别;S7、Web页挖掘:随着Internet的迅速发展及Web的全球普及,使得Web上的信息量无比丰富,通过对Web的挖掘,可以利用Web的海量数据进行分析,收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息,集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息,并根据分析结果找出企业管理过程中出现的各种问题和可能引起危机的先兆,对这些信息进行分析和处理,一般是不分析、评价和管理危机;S8、在通过物联网采用以上方式挖掘后,便可对挖掘的数据进行分析处理,处理时根据数据挖掘信息选取一个或多个优越的经营模式,并在此进过上述对应步骤多次验证该分析模式,然后选取数据相对稳定的作为评价预备数据,并将数据输入计算机进行虚拟模拟计算分析该经营模式。优选的,所述S2中,其主管表现在几个方面:(1)判别自变量是否能解释因变量的显著变化---关系是否存在、(2)判别自变量能够在多大程度上解释因变量----关系的强度、(3)判别关系的结构或形式----反映因变量和自变量之间相关的数学表达式、(4)预测自变量的值、(5)当评价一个特殊变量或一组变量对因变量的贡献时,对其自变量进行控制。优选的,所述S3中,其分析算法分为以下几类:(1)划分方法、(2)层次的方法、(3)基于密度的方法、(4)基于网格的方法、(5)基于模型的方法,该方法可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分,按忠诚卡记录的光临次数、光临时间、年龄、职业,还有银行信用卡的黄金客户,按储蓄额、刷卡消费金额和诚信度。优选的,所述S1中,其主要分类方法有决策树、KNN法(K-NearestNeighbor)、SVM法、VSM法、Bayes法、神经网络。与现有技术相比,本专利技术具有如下有益效果:本专利技术中,通过物联网采用多种方式挖掘后,便可对挖掘的数据进行分析处理步骤,处理时根据数据挖掘信息选取一个或多个优越的经营模式,并在此经过上述对应步骤多次验证该分析模式,然后选取数据相对稳定的作为评价预备数据,并将数据输入计算机进行虚拟模拟计算分析该经营模式,这样多次对网络挖掘数据的验证和分析可以使得数据更加趋于准确,并且对该网络数据进行相应的计算机模拟,使得可以更大化的规避经营风险。附图说明图1为本专利技术一种物联网数据挖掘方法的流程步骤图;图2为本专利技术一种物联网数据挖掘方法的分析处理的步骤流程图;图3为本专利技术一种物联网数据挖掘方法的回归分析图;图4为本专利技术一种物联网数据挖掘方法的聚类分析图;图5为本专利技术一种物联网数据挖掘方法的关联规则图;图6为本专利技术一种物联网数据挖掘方法的特征分析图。具体实施方式为使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本专利技术。在本专利技术的描述中,需要说明的是,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。如图1-6所示,一种物联网数据挖掘方法,物联网数据挖掘方法步骤包括有分类、回顾分析、聚类、关联规则、特征、变化和偏差分析和Web页挖掘,该方法操作方式分为以下具体步骤:S1、分类:本文档来自技高网...

【技术保护点】
1.一种物联网数据挖掘方法,其特征在于:所述物联网数据挖掘方法步骤包括有分类、回顾分析、聚类、关联规则、特征、变化和偏差分析和Web页挖掘,所述该方法操作方式分为以下具体步骤:/nS1、分类:找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别,可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测,当前的市场营销中很重要的一个特点是强调客户细分,客户类别分析的功能也在于此,采用数据挖掘中的分类技术,可以将客户分成不同的类别。/n

【技术特征摘要】
1.一种物联网数据挖掘方法,其特征在于:所述物联网数据挖掘方法步骤包括有分类、回顾分析、聚类、关联规则、特征、变化和偏差分析和Web页挖掘,所述该方法操作方式分为以下具体步骤:
S1、分类:找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别,可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测,当前的市场营销中很重要的一个特点是强调客户细分,客户类别分析的功能也在于此,采用数据挖掘中的分类技术,可以将客户分成不同的类别。


2.比如呼叫中心设计时可以分为:呼叫频繁的客户、偶然大量呼叫的客户、稳定呼叫的客户、其他,帮助呼叫中心寻找出这些不同种类客户之间的特征,这样的分类模型可以让用户了解不同行为类别客户的分布特征;
S2、回归分析:反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系,其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系;
S3、聚类分析:把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能的小;
S4、关联规则:描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可到处另一些项在同一事物中也出现,即隐藏在数据间的关联或相互关系;
S5、特征分析:从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的总体特征,特征选择的目的在于从海量数据中提取出有用信息,从而提高数据的使用效率,其中,特征有效性的选择评价有概率论、数理统计、信息论、IR领域的度量;
S6、变化和偏差分析:偏差包括很大一类潜在有趣的知识,如分类中的反常实例,模式的例外,观察结果对期望的偏差等,其目的是寻找观察结果与参照量之间有意义的差别;
S7、We...

【专利技术属性】
技术研发人员:陈林辉陈自飞
申请(专利权)人:江西国云科技有限公司成都亿鼎云科技有限公司
类型:发明
国别省市:江西;36

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1