基于关联规则的卷烟配方维护行为挖掘系统及其方法技术方案

技术编号:2915390 阅读:423 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于关联规则的卷烟配方维护行为挖掘系统及其方法。它包括数据库服务器和数据挖掘客户端,其中数据挖掘客户端包括可视化展示工具,该可视化展示工具与数据展示处理模块和结果展示模块连接;数据展示处理模块与数据连接模块连接,数据连接模块提供各种不同数据类型格式数据源的连接,生成挖掘算法可以直接使用的数据库,提供数据对象访问的接口;结果展示模块与挖掘处理模块连接,挖掘处理模块分别与模型库模块、模型评估模块和数据连接模块连接;数据连接模块则与身份验证处理模块和数据库服务器中的数据源连接,同时身份验证处理模块与数据库服务器中的权限数据库连接,身份验证处理模块通过用户名和密码验证用户的合法性。

【技术实现步骤摘要】

本专利技术涉及一种基于关联规则的卷烟配方维护行为挖掘系统及其方法
技术介绍
卷烟产品的风格是消费者选购卷烟的重要依据。从消费者角度来看,卷烟的风格包括劲头、卷烟的留香、口腔的感受和烟气的浓度及走势。保持卷烟风格的相对稳定性是建立品牌的基本要求。卷烟风格的保持受许多主客观因素的影响,其中最重要的就是保持叶组配方的相对稳定性。由于不同地区,不同档次和部位的烟叶的化学成分相差较大,对卷烟产品的质量影响也是最大的,只有叶组配方的相对稳定,才能保证一个品牌烟的风格稳定。实际生产中由于原材料的生产量有限,供应量和实际需求量存在差距,所以当叶组配方中一种烟叶或几种烟叶出现库存短缺或价格、质量方面的波动时,需要用另一种品质特征近似的烟叶来替换。因此寻找与这些烟叶在品质特征上最能接近的替代烟叶,而使整个产品的质量不受影响,保持该品牌卷烟质量的相对稳定性就成了研究的关键问题。近年来,许多卷烟配方研究人员致力于研究一种快速选择替代烟叶的方法。目前常见的方法有两种,一种是根据经验选择产地、等级接近的烟叶作为替代烟叶;另一种是以检测的常规化学成分、烟气成分为依据,利用层次聚类法建立烟叶的分类模型,通过建立的模型对需要替代的烟叶找出其相对优化的替代品。第一种方法的缺陷是替代效率低,往往需要多次调试才能成功;第二种方法是检测工作需要耗费大量的人力、物力和材料,而且烟叶中的化学成分多达上千种,目前已检测的化学成分只占少数,难以说明烟叶质量的相似性。这两种方法的共同缺点是没有考虑替代烟叶的协同互补性,单纯只依靠某种方法,难以实现叶组的最优搭配。卷烟叶组配方中烟叶的协同互补性又很难用语言描述,这些规律都隐含在历史的叶组配方维护数据中。在历史配方数据中,积累了很多烟叶组合的规律,充分挖掘这些规律中烟叶的搭配和协同信息,可以直接有效的指导实际的配方维护。关联规则算法是一种很好的挖掘烟叶间组合和搭配的方法。关联规则挖掘是一种应用广泛的机器学习技术,它运用统计原理,在海量的数据中发现数据项之间的关系,1993年Agrawal等人首先提出了交易数据库中不同商品之间的关联规则挖掘,并逐渐被改进优化。目前关联规则挖掘技术已经被广泛应用在金融行业的客户需求和销售领域的购物篮分析中。但把关联规则应用到工业生产和烟草产品配方维护中还没有先例。-->关联规则挖掘问题可以分为:发现频繁项目集和生成关联规则两个子问题,其中发现所有的频繁项集是生成关联规则的基础。
技术实现思路
本专利技术的目的就是为克服传统卷烟叶组配方维护方法的弊端,提供一种能够充分利用卷烟企业所积累的历史数据,将叶组配方数据中隐含的多位卷烟配方专家维护配方时的行为规律提取为规则表示形式,并且全面地考虑烟叶间的优化组合,更高效、实际地指导卷烟产品的配方维护,达到保持卷烟产品配方的相对稳定性的目的基于关联规则的卷烟配方维护行为挖掘系统及其方法。为实现上述目的,本专利技术采用如下技术方案:一种基于关联规则的卷烟配方维护行为挖掘系统,它包括数据库服务器和数据挖掘客户端,其中数据挖掘客户端包括可视化展示工具,该可视化展示工具与数据展示处理模块和结果展示模块连接;数据展示处理模块与数据连接模块连接,数据连接模块提供各种不同数据类型格式数据源的连接,生成挖掘算法可以直接使用的数据库,提供数据对象访问的接口;结果展示模块与挖掘处理模块连接,挖掘处理模块分别与模型库模块、模型评估模块和数据连接模块连接;数据连接模块则与身份验证处理模块和数据库服务器中的数据源连接,同时身份验证处理模块与数据库服务器中的权限数据库连接,身份验证处理模块通过用户名和密码验证用户的合法性。所述可视化展示工具和结果展示模块通过直方图、点线图、表格形式直观展示处理结果。所述挖掘处理模块提供关联规则的数据挖掘算法,设定、修改关联规则算法的参数,执行用户提交的数据挖掘任务。所述模型评估模块利用不同挖掘模型对测试数据进行挖掘分析,对结果进行评估,根据评估结果选择相应的挖掘模型进行数据挖掘。一种基于关联规则的卷烟配方维护行为挖掘系统的使用方法,包括以下步骤:Step1:进入系统启动系统,输入用户名和密码,进行用户身份验证;用户名密码正确,则通过验证,进入系统;用户名或密码不正确,则退出系统;Step2:设置数据库,导入卷烟叶组配方数据;该系统对不同服务器上的数据库进行模型的建立和输入,选择服务器连接和数据库数据源;导入数据库中的卷烟叶组配方数据,作为关联规则模型的训练数据;Step3:建立频繁烟叶组合模型-->卷烟生产中,不同档次的卷烟其用料不同,烟叶组合使用情况也不同;要挖掘烟叶搭配使用的规律,找到频繁烟叶组合模型,必须按档次进行划分;然后分别对高档烟,中档烟和低档烟建立关联规则模型;(1)指定导入的历史卷烟配方数据为关联规则模型的训练数据;(2)设置算法参数:MAXIMUM_ITEMSET_COUN(最大项集个数)指定要生成的最大项集个数;MAXIMUM_ITEMSET_SIZE(最大项集大小)指定一个项集中允许的最大项数;MAXIMUM_SUPPORT(最大支持度)指定可包含某项集的最大事例数;MINIMUM_IMPORTANCE(最小重要性)指定关联规则的重要性阈值;重要性低于此值的规则将被筛选出去;MINIMUM_ITEMSET_SIZE(最小项集大小)指定一个项集中允许的最小项数;MINIMUX_PROBABILITY(最小概率)指定规则为True的最小概率;MINIMUM_SUPPORT(最小支持度)指定包含该项集的最小事例数;(3)调用关联规则算法训练模型,得出当前频繁烟叶组合模型;Step4:建立烟叶替换规则模型(1)导入数据库中的烟叶替换记录的数据;(2)设置关联规则算法参数MAXIMUM_SUPPORT(最小支持度);用替换前烟叶作为输入,替换后烟叶作为输出;(3)调用关联规则算法训练模型,得出烟叶替换规则;Step5:推荐最佳替换烟叶根据上述的Step3和Step4,已经产生了频繁烟叶组合模型和烟叶替换规则模型;输入卷烟的档次信息和烟叶名称以及推荐个数,调用关联规则算法建立的上述两个叶组配方维护行为挖掘模型;系统自动输出可作为替代烟叶的方案,并给出重要性值.Step6:频繁烟叶组合模型和烟叶替换规则模型性能评价应用计算烟叶替代实例的预测正确率来评价基于关联规则算法训练后建立的频繁烟叶组合模型和烟叶替换规则模型的性能;如将10个已有烟叶调整方案的卷烟叶组配方作为测试样本,将实际替代烟叶与模型给出的替代烟叶进行对比,正确率未达到设定值,则转到Step3,并且调整模型参数MINIMUM_SUPPORT(最小支持度),MINIMUX_PROBABILITY(最小概率);当正确率达到要求,则将转到步骤Step7保存所述模型;Step7:保存频繁烟叶组合模型和烟叶替换规则模型通过Step6模型性能评价后,保存建立的烟叶频繁项集模型和烟叶替换规则模型到数据库中,以应用于今后的叶组配方维护过程中;并展示挖掘出的频繁烟叶组合规则和烟叶替换关系的规则。-->本专利技术的有益效果是:1.按照本专利技术所提供的基于关联规则的卷烟配方维护行为挖掘系统,可以快速、准确、自动地实现烟叶替代。2.按照本专利技术所提供的基于关联规则的卷烟配方维护行为挖掘系统,数据可本文档来自技高网
...

【技术保护点】
一种基于关联规则的卷烟配方维护行为挖掘系统,其特征是,它包括数据库服务器(1)和数据挖掘客户端(2),其中数据挖掘客户端(2)包括可视化展示工具(3),该可视化展示工具(3)与数据展示处理模块(4)和结果展示模块(5)连接;数据展示处理模块(4)与数据连接模块(6)连接,数据连接模块(6)提供各种不同数据类型格式数据源的连接,生成挖掘算法可以直接使用的数据库,提供数据对象访问的接口;结果展示模块(5)与挖掘处理模块(7)连接,挖掘处理模块(7)分别与模型库模块(8)、模型评估模块(9)和数据连接模块(6)连接;数据连接模块(6)则与身份验证处理模块(10)和数据库服务器(1)中的数据源(11)连接,同时身份验证处理模块(10)与数据库服务器(1)中的权限数据库(12)连接,身份验证处理模块(10)通过用户名和密码验证用户的合法性。

【技术特征摘要】
1.一种基于关联规则的卷烟配方维护行为挖掘系统,其特征是,它包括数据库服务器(1)和数据挖掘客户端(2),其中数据挖掘客户端(2)包括可视化展示工具(3),该可视化展示工具(3)与数据展示处理模块(4)和结果展示模块(5)连接;数据展示处理模块(4)与数据连接模块(6)连接,数据连接模块(6)提供各种不同数据类型格式数据源的连接,生成挖掘算法可以直接使用的数据库,提供数据对象访问的接口;结果展示模块(5)与挖掘处理模块(7)连接,挖掘处理模块(7)分别与模型库模块(8)、模型评估模块(9)和数据连接模块(6)连接;数据连接模块(6)则与身份验证处理模块(10)和数据库服务器(1)中的数据源(11)连接,同时身份验证处理模块(10)与数据库服务器(1)中的权限数据库(12)连接,身份验证处理模块(10)通过用户名和密码验证用户的合法性。2.如权利要求1所述的基于关联规则的卷烟配方维护行为挖掘系统,其特征是,所述可视化展示工具(3)和结果展示模块(5)通过直方图、点线图、表格形式直观展示处理结果。3.如权利要求1所述的基于关联规则的卷烟配方维护行为挖掘系统,其特征是,所述挖掘处理模块(7)使用关联规则的数据挖掘算法,设定、修改算法的参数,执行用户提交的数据挖掘任务。4.如权利要求1所述的基于关联规则的卷烟配方维护行为挖掘系统,其特征是,所述模型评估模块(9)利用不同挖掘模型对测试数据进行挖掘分析,对结果进行评估,根据评估结果选择相应的挖掘模型进行数据挖掘。5.如权利要求1所述的基于关联规则的卷烟配方维护行为挖掘系统的使用方法,其特征是,包括以下步骤:Step1:进入系统启动系统,输入用户名和密码,进行用户身份验证;用户名密码正确,则通过验证,进入系统;用户名或密码不正确,则退出系统;Step2:设置数据库,导入卷烟叶组配方数据该系统可以设置不同的服务器和数据源,满足服务器和数据库修改的配置要求;Step3:建立频繁烟叶组合模型卷烟生产中,不同的档次的烟的用料不同,烟叶组合使用情况也不同;要挖掘烟叶搭配使用的规律,找到频繁烟叶组合模型,必须按档次进行划分;然后分别对高档烟,中档烟和低档烟建立关联规则模型:(1)在数据库中保存历史卷烟配方的数据表;(2)设置算法参数:最大项集数MAXIMUM_ITEMSET_COUN指定要生成的最大项集数;最大项集的大小MAXIMUM_ITEMSET_SIZE指定一个项集中允许的最大项数;最大支持度MAXIMUM_SUPPORT指定可包含某项集的最大事例数;最小重要性MINIMUM_IMPORTANCE指定关联规则的重要性阈值;重要性低于此值的规则将被筛选出去;最小项集的大小MINIMUM_ITEMSET_SIZE指定一个项集中允许的最小项数;最小概率MINIMUX_PROBABILITY指定规则为T...

【专利技术属性】
技术研发人员:段玲阮晓明赵砚棠宋学艳李成富姜福东张金林孟广宇杨宁贺英刘勃刘红伟
申请(专利权)人:山东中烟工业公司中国海洋大学
类型:发明
国别省市:88[中国|济南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1