一种数据挖掘系统和方法技术方案

技术编号:14637034 阅读:133 留言:0更新日期:2017-02-15 11:12
本发明专利技术公开了一种数据挖掘系统和方法,所述数据挖掘系统包括:数据管理服务器,其采集、存储和预处理客户金融数据;数据采集终端,用于向客户提供操作平台,实现客户金融数据管理;挖掘处理服务器,与所述数据采集终端和数据管理服务器连接,用于接受管理控制器的挖掘任务,调用挖掘工具,在指定的挖掘数据集上进行挖掘并得到客户价值得分和客户响应得分。本发明专利技术通过对客户金融数据的采集和整理,然后对所述客户金融数据进行分析,通过RFM模型和权重系数得到客户价值得分和客户响应得分,从而从大量的数据中得到有用的信息。

【技术实现步骤摘要】

本专利技术涉及一种数据挖掘系统和方法
技术介绍
当今世界是一个信息化和数量化的时代,每天都有不计其数的数据在产生。目前,金融机构为实现科学化管理决策,其许多业务活动(如客户分析、投资决策、风险管理、价格预测等)都越来越依赖于对大量历史数据的分析。数据挖掘则是一门能自动从大量数据中发现其隐藏的、有用的、令客户感兴趣的模式和规律并以简洁、易于理解的形式为人们的决策提供信息的技术。其概念在1989国际人工智能联合会议(IJCAI)上首次提出,立即引起国际上很多学者、机构的重视。在90年代掀起了数据挖掘的研究热潮,到目前,经过十来年的努力,已取得很大进展,并已成功应用于许多行业。金融风险是金融活动的内在属性,其广泛存在是现代金融市场的重要特征。20世纪70年代以来,由于放松管制与金融自由化、信息技术与金融创新活动等因素的影响,金融市场的波动性增强,金融体系的稳定性下降。这对风险管理的技术、方法的创新提出了越来越紧迫的要求。现代信息技术在风险管理中扮演的角色越来越重要。国际上的大型金融机构都非常重视采用最新的信息技术,建立先进的风险管理系统和开发新的风险管理方法。事实上,金融风险的本质在于金融活动中未来收益(损失)的不确定性,因而风险管理的目的就是要如何度量,降低甚至消除各种不确定性。这又关键依赖于信息和知识的获取。而从大量纷繁复杂的数据当中获取有意义的信息正是数据挖掘的本质所在。
技术实现思路
本专利技术目的是提供一种数据挖掘系统和方法,其能够通过RFM模型和权重系数得到客户价值得分和客户响应得分,从而从大量的数据中得到有用的信息。本专利技术解决技术问题采用如下技术方案:一种数据挖掘系统,其包括:数据管理服务器,其采用网页爬虫采集客户金融数据,并存储客户金融数据,以及对所述客户金融数据进行预处理;数据采集终端,用于向客户提供操作平台,实现客户金融数据管理;挖掘处理服务器,与所述数据采集终端和数据管理服务器连接,用于接受管理控制器的挖掘任务,调用挖掘工具,在指定的挖掘数据集上进行挖掘并得到客户价值得分和客户响应得分。可选的,所述挖掘处理服务器包括:RFM模型建立单元,用于建立金融领域适用的RFM模型;权重系数确定单元,用于确定RFM模型中的各变量的权重系数;客户价值评分计算单元,用于计算客户价值评分,其中所述客户价值评分包括客户价值得分和客户响应得分;显示单元,用于显示上述客户价值评分。可选的,所述权重系数确定单元包括:判断矩阵构造模块,用于构造判断矩阵P;特征向量W计算模块,用于计算特征向量W;特征根计算单元,用于计算上述判断矩阵的特征根;以及一致性检验单元,用于检验特征根和向量是否具备一致性。本专利技术解决技术问题还采用如下技术方案:一种数据挖掘方法,其包括:S10、建立金融领域适用的RFM模型;S20、确定RFM模型中的各变量的权重系数;S30、计算得到客户价值评分,所述客户价值评分包括客户价值得分和客户响应得分。可选的,步骤S10中,所述RFM模型中的变量包括:最近一次的投资时间,以R1表示;项目到期日期与当前分析日期的时间间隔,以R2表示;累计得到的客户最大可投资金额,以M1表示;客户可追加投资额,以M2表示;频次,以F表示。可选的,所述步骤S20具体为:S201、构造判断矩阵P;所述判断矩阵P为3×3的矩阵,其元素aij表示第i行的变量相对于第j列的变量的重要程度,其中i为1,2,3;j为1,2,3;S202、计算特征向量W;在上述判断矩阵P的基础上,计算每一行元素的乘积Mi;计算Mi的三次方根,得到Wi;对W1、W2和W3通过公式做归一化处理,得到向量W=(W1',W2',W3');S203、通过公式计算上述判断矩阵P的特征根;式中,(PW)i表示PW的第i个元素,且u=3;S204、一致性检验;计算当CR值若小于0.1,则表明判断矩阵P具有满意的一致性,此时该特征向量W即是权重系数(a,b,c)。可选的,客户价值得分Sj=a×M1+b×R1+c×F1;客户响应得分Sx=a×M2+b×R2+c×F2。本专利技术具有如下有益效果:本专利技术通过对客户金融数据的采集和整理,然后对所述客户金融数据进行分析,通过RFM模型和权重系数得到客户价值得分和客户响应得分,从而从大量的数据中得到有用的信息。附图说明图1为本专利技术的数据挖掘系统的结构示意图;图2为本专利技术的数据挖掘方法的流程图;具体实施方式下面结合实施例及附图对本专利技术的技术方案作进一步阐述。实施例1本实施例提供了一种数据挖掘系统,基于计算机局域网,采用分布式结构,并包括:数据管理服务器,其采用网页爬虫采集客户金融数据,并存储客户金融数据,以及对所述客户金融数据进行预处理;所述预处理包括:根据客户金融数据计算每位客户在生命周期内累计的最大可投资金额(即下文M1,客户最大可投资金额)、当前在库金额、最近一次项目到期日期(赎回日期)与当前分析日期的时间间隔(即下文R2)以及填补最大可投资金额的缺失值(采用贝叶斯或线性回归填补客户累计最大投资额度)。其中,累计客户最大可投资金额并非单纯累加每次投资的金额,因为每次投资的金额中可能有上次到期的客户投资回款。从而为整个系统提供挖掘基础数据和应用原始数据,根据具体情况需要,它与Internet和其它业务数据库服务器相连。数据采集终端,用于向客户提供操作平台,实现客户金融数据管理、规则知识维护、应用模型建立和模型应用的维护控制命令的发布。本实施例中,所述数据采集终端通过P2P或者类似的投资网站以及金融产品展示网站,客户通过注册账号并向网站中的账户进行充值从而进行投资行为,即向客户提供操作平台,并能够通过客户的投资行为获得客户金融数据;同时,所述数据采集终端也可以爬取其他相关网站数据,从而获得客户金融数据并进行管理。所述规则知识维护为通过点击量PV、独立访客UV、访问率、注册率、初投率、复投率、平均单客投资额的指标维护平台运营情况;所述应用模型建立为按以上维度建立平台运营模型,如平台投标业绩=PV×UV×(注册人数/UV)×(投资人数/注册人数)×(投资总额/投资人数);所述模型应用的维护控制命令的发布为通过对不同指标正常范围的控制来监督平台的运营情况,如某一指标值得范围超过其年度平均值3倍标准差时,需要认定此指标有异常。挖掘处理服务器,与所述数据采集终端和数据管理服务器连接,用于接受管理控制器的挖掘任务,调用挖掘工具,在指定的挖掘数据集上进行挖掘;并包括:金融领域适用的RFM模型建立单元,用于建立金融领域适用的RFM模型;所述RFM模型中的变量包括:最近一次的投资时间,以R1表示;项目到期日期(赎回日期)与当前分析日期的时间间隔,即按照业务数据库信息,客户投资响应最强的时候是其已投资项目将要到期的时候,以R2表示;累计得到的客户最大可投资金额,以M1表示;客户可追加投资额,即客户最大可投金额与当前在库金额的差,以M2表示;频次,以F表示。权重系数确定单元,用于确定RFM模型中的各变量的权重系数,采用AHP原理计算得到各变量的权重系数,例如a表示变量M1和M2的权重系数;b表示变量R1和R2的权重系数;c表示变量F的权重系数,其中,a+b+c=1。客户价值评分计算单元,用于计算客户价值评分,其中所述客户价值评分包括客户价值得分本文档来自技高网...
一种数据挖掘系统和方法

【技术保护点】
一种数据挖掘系统,其特征在于,包括:数据管理服务器,其采用网页爬虫采集客户金融数据,并存储客户金融数据,以及对所述客户金融数据进行预处理;数据采集终端,用于向客户提供操作平台,实现客户金融数据管理;挖掘处理服务器,与所述数据采集终端和数据管理服务器连接,用于接受管理控制器的挖掘任务,调用挖掘工具,在指定的挖掘数据集上进行挖掘并得到客户价值得分和客户响应得分。

【技术特征摘要】
1.一种数据挖掘系统,其特征在于,包括:数据管理服务器,其采用网页爬虫采集客户金融数据,并存储客户金融数据,以及对所述客户金融数据进行预处理;数据采集终端,用于向客户提供操作平台,实现客户金融数据管理;挖掘处理服务器,与所述数据采集终端和数据管理服务器连接,用于接受管理控制器的挖掘任务,调用挖掘工具,在指定的挖掘数据集上进行挖掘并得到客户价值得分和客户响应得分。2.根据权利要求1所述的数据挖掘系统,其特征在于,所述挖掘处理服务器包括:RFM模型建立单元,用于建立金融领域适用的RFM模型;权重系数确定单元,用于确定RFM模型中的各变量的权重系数;客户价值评分计算单元,用于计算客户价值评分,其中所述客户价值评分包括客户价值得分和客户响应得分;显示单元,用于显示上述客户价值评分。3.根据权利要求2所述的数据挖掘系统,其特征在于,所述权重系数确定单元包括:判断矩阵构造模块,用于构造判断矩阵P;特征向量W计算模块,用于计算特征向量W;特征根计算单元,用于计算上述判断矩阵的特征根;以及一致性检验单元,用于检验特征根和向量是否具备一致性。4.一种数据挖掘方法,其特征在于,包括:S10、建立金融领域适用的RFM模型;S20、确定RFM模型中的各变量的权重系数;S30、计算得到客户价值评分,所述客户价值评...

【专利技术属性】
技术研发人员:金士隆
申请(专利权)人:国信优易数据有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1