一种数据分析方法技术

技术编号:16080051 阅读:85 留言:0更新日期:2017-08-25 15:31
本发明专利技术提供了一种数据分析方法,采用了相关联的两个门限值进行分析,在不同的门限值的条件下采用不同的数据分析算法。由于目前的数据分析方法有门限值的设定,而此门限值是用户根据自身经验设置的,采用此门限值进行分析可能会把某些有价值的少量数据过滤掉,而通过本发明专利技术设计的方法则可以避免过滤掉有价值的少量数据,做到分析的全面性和客观性,提高了分析的准确性。

【技术实现步骤摘要】
一种数据分析方法
本专利技术涉及数据处理分析领域,具体而言,涉及一种数据分析方法。
技术介绍
大数据(bigdata)一词经常被用以描述和指代信息爆炸时代产生的海量信息。研究大数据的意义在于发现和理解信息内容及信息与信息之间的联系。目前大部分的互联网公司都会在后台存储有用户的数据信息,成为用户大数据信息,通过分析这些数据信息,获取用户的行为,从而可以推荐用户感兴趣的网页或者商品信息,或者调整网页的页面满足用户的喜好,或者预测用户行为,为其提供更好的服务,这样才会给公司带来更多的用户,才能有利于互联网公司的发展。互联网公司的竞争日趋激烈,通过合适的分析用户数据对其进行个性化的服务,能有效的保留用户,以防客户流失。目前针对数据分析的算法较多,但大多算法都是在成熟的算法中进行的相应改进,并不适合所有的情景。如何设计一种能提高分析效率,解决有价值的稀少数据的分析算法是亟不可待解决的问题。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。为此,本专利技术提供了一种数据分析方法,具体步骤如下:步骤1,读取数据库中存储的数据集合;步骤2,采用项目集合概率法进行计算第一门限值本文档来自技高网...
一种数据分析方法

【技术保护点】
一种数据分析方法,其特征在于,包括以下步骤:步骤1,读取数据库中存储的数据集合;步骤2,采用项目集合概率法进行计算第一门限值S1;步骤3,根据所述第一门限值S1和项目属性计算第二门限值S2;步骤4,提取数据库中的数据集合,并计算其中每个项目数据集合特定值,判断所述项目数据集合特定值是否大于等于所述第一门限值S1,若大于等于所述第一门限值S1,则进行步骤5,若判断小于所述第一门限值S1,则进行步骤6;步骤5,采用预设的第一规则算法计算关联规则;步骤6,判断所述项目数据集合特定值是否大于等于所述第二门限值S2,若大于等于第二门限值S2,则进行步骤7,所小于所述第二门限值,则进行步骤8;步骤7,采用...

【技术特征摘要】
1.一种数据分析方法,其特征在于,包括以下步骤:步骤1,读取数据库中存储的数据集合;步骤2,采用项目集合概率法进行计算第一门限值S1;步骤3,根据所述第一门限值S1和项目属性计算第二门限值S2;步骤4,提取数据库中的数据集合,并计算其中每个项目数据集合特定值,判断所述项目数据集合特定值是否大于等于所述第一门限值S1,若大于等于所述第一门限值S1,则进行步骤5,若判断小于所述第一门限值S1,则进行步骤6;步骤5,采用预设的第一规则算法计算关联规则;步骤6,判断所述项目数据集合特定值是否大于等于所述第二门限值S2,若大于等于第二门限值S2,则进行步骤7,所小于所述第二门限值,则进行步骤8;步骤7,采用预设的第二规则算法计算关联规则;步骤8,删除小于所述第二门限值的项目数据集合;重复上述步骤4-8,直至数据库中的所有项目数据集合都处理完毕;显示计算的关联规则结果。2.根据权利要求1所述的一种数据分析方法,其特征在于,所述步骤2具体为:步骤21,遍历数据库,统计每个项目集合在数据库中出现概率;步骤22,根据用户预设的第一百分比值,找出最接近所述第一百分比值对应的两个项目集合的概率值;步骤23,计算两个项目集合的概率差值;步骤24,用户预设的第一百分比值与所述两个项目集合的概率差值相加,结果为第一门限值S1。3.根据权利要求1所述的一种数据分析方法,其特征在于,所述步骤3具体为:第二门限值通过以下公式进行计算,S2=S1-β×q(t),其中β为用户设定的允许降低的范围,q(t)为项目属性,其通过以下公式进行计算,

【专利技术属性】
技术研发人员:潘碧涛曾刚
申请(专利权)人:广州油融互联网金融信息服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1