System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据挖掘全流程方法及装置制造方法及图纸_技高网

一种数据挖掘全流程方法及装置制造方法及图纸

技术编号:40292483 阅读:5 留言:0更新日期:2024-02-07 20:42
本文提供了一种数据挖掘全流程方法及装置,方法包括:对获取的客户交易流水信息进行分析,生成客户的交易场景还原特征;由客户基础数据及客户交易场景还原特征构成客户画像信息;生成模型训练配置界面;接收用户通过模型训练配置界面配置的模型信息;根据文件标识、输入参数标识、输出参数标识及预处理信息,从数据库中获取训练样本;利用训练样本及算法标识对应的训练程序,训练预测模型;根据输入参数标识生成交互界面,发送交互界面至客户端显示;接收用户通过交互界面输入的待分析客户的特征信息,将待分析客户的特征信息输入至预测模型中得到预测结果,发送预测结果至客户端显示。本文能够简化用户操作,降低预测模型建立难度。

【技术实现步骤摘要】

本文涉及大数据领域,尤其涉及一种数据挖掘全流程方法及装置


技术介绍

1、随着大数据技术的迅猛发展,传统广撒网式的信息推送模式存在如下缺陷:(1)信息推送准确率低、资源耗费高;(2)无法满足客户服务深度与粘性提升上的发展要求;(3)存在数据价值浪费及用户体验差的问题,具体的,不能发现海量客户信息中的潜在价值,对目标客户提供针对性的产品和服务。

2、现有技术中,对于已有数据价值的挖掘,主要有如下两种方式:

3、第一种,通过数据统计分析手段实现,该种方式利用手工计算、阈值设定等方式构建模型,以场景事件驱动信息推送模式,锁定目标客群,该种方式建立的模型仅能确定变量特征之间的关系,无法根据数据预测行为,且手工计算的方式在海量数据处理上存在一定局限性;

4、第二种,现有机器学习挖掘数据价值的手段存在流程复杂,对业务人员技术门槛要求高,普及难度大。市面上已有机器学习软件为面向全行业的技术人员的工具,不能与业务场景深度融合,且同样对业务人员技术门槛要求高,普及难度大。


技术实现思路

1、本文用于解决现有数据挖掘时未与业务场景融合,且数据挖掘过程存在流程复杂、对业务人员技术门槛要求高、不利于普及的问题。

2、为了解决上述技术问题,本文一方面提供一种数据挖掘全流程方法,包括:

3、利用定时调度任务从业务源系统获取客户信息,将客户信息存入数据库中,其中,所述客户信息包括客户基础数据、各渠道的消费行为数据,所述消费行为数据包括多个交易流水信息;

4、利用预先建立的交易场景词典对获取的客户交易流水信息进行分析,生成客户的交易场景还原特征,并将其存入所述数据库中;

5、由客户基础数据及客户交易场景还原特征,构成客户画像信息;

6、根据预设建模算法、已有文件、客户画像信息中的特征、预设预测结果、预处理算法,生成模型训练配置界面;

7、接收用户通过模型训练配置界面配置的模型信息,其中,所述模型信息包括算法标识、文件标识、输入参数标识、输出参数标识及预处理信息;

8、根据所述文件标识、输入参数标识、输出参数标识及预处理信息,从数据库中获取训练样本;

9、利用训练样本及算法标识对应的训练程序,训练预测模型;

10、根据所述输入参数标识生成交互界面,发送交互界面至客户端显示;

11、接收用户通过交互界面输入的待分析客户的特征信息,将待分析客户的特征信息输入至预测模型中得到预测结果,发送预测结果至客户端显示。

12、作为本文进一步实施例中,数据挖掘全流程方法还包括:

13、利用监控程序监控客户信息获取是否正常,若不正常,则发出提醒信息至运维人员。

14、作为本文进一步实施例中,发送预测结果至客户端显示时还包括:

15、获取历史预测结果的成功率;

16、发送历史预测结果的成功率至客户端显示;

17、其中,历史预测结果的成功率确定过程包括:

18、获取与待分析客户相似客户的信息推送结果及预测结果;

19、根据相似客户的信息推送结果及预测结果计算成功率。

20、作为本文进一步实施例中,利用预先建立的交易场景词典对获取的客户交易流水信息进行分析,生成客户的交易场景还原特征包括:

21、根据渠道-技术摘要区字典表,确定客户各渠道的每一笔交易流水信息中的技术摘要信息,其中,所述渠道-技术摘要区字典表包括渠道与技术摘要字段信息的对应关系;

22、对客户各渠道的每一笔交易流水信息中的技术摘要信息进行数据清洗;

23、对清洗后每一笔交易流水信息进行分词处理,并提取关键字;

24、将客户每一笔交易流水信息的关键字与交易场景词典进行匹配,将匹配成功的第一级业务场景及第二级业务场景作为客户每一笔交易流水信息的业务场景还原特征,其中,所述交易场景词典包括第一级业务场景与第二级业务场景以及关键词间的关联关系;

25、根据客户每一笔交易流水信息的业务场景还原特征,统计得到客户的业务场景还原特征。

26、作为本文进一步实施例中,还包括:建立模型信息与交互界面间的关联关系;

27、接收用户通过模型训练配置界面配置的模型信息之后还包括:

28、查询最近预定时间段内是否存在相同模型信息,若是,则根据模型信息及其与交互界面间的关联关系,获取交互界面,发送交互界面至客户端。

29、作为本文进一步实施例中,根据所述文件标识、输入参数标识、输出参数标识及预处理信息,从数据库中获取训练样本包括:

30、从数据库中获取文件标识对应的文件;

31、对于文件中每一客户的数据,提取输入参数标识对应的该客户的输入参数数据,提取输出参数标识对应的该客户的输出参数数据;

32、按照预处理信息对该客户的输入参数数据进行预处理,由该客户的预处理后的参数数据构成一样本的输入,由该客户的输出参数数据构成该样本的输出。

33、作为本文进一步实施例中,所述模型训练配置界面包括:模板选择控件及文件选择控件;

34、用户通过触控所述模板选择控件显示各类预测模型的配置模板,所述配置模板中预设有算法标识、输入参数标识、输出参数标识及预处理信息;

35、用户通过触控所述文件选择控件显示已有文件标识。

36、本文第二方面提供一种数据挖掘全流程装置,包括:

37、数据获取单元,用于利用定时调度任务从业务源系统获取客户信息,将客户信息存入数据库中,其中,所述客户信息包括客户基础数据、各渠道的消费行为数据,所述消费行为数据包括多个交易流水信息;

38、场景还原单元,用于用预先建立的交易场景词典对获取的客户交易流水信息进行分析,生成客户的交易场景还原特征,并将其存入所述数据库中;

39、画像建立单元,用于由客户基础数据及客户交易场景还原特征,构成客户画像信息;

40、配置界面生成单元,用于根据预设建模算法、已有文件、客户画像信息中的特征、预设预测结果、预处理算法,生成模型训练配置界面;

41、参数确定单元,用于接收用户通过模型训练配置界面配置的模型信息,其中,所述模型信息包括算法标识、文件标识、输入参数标识、输出参数标识及预处理信息;

42、样本确定单元,用于根据所述文件标识、输入参数标识、输出参数标识及预处理信息,从数据库中获取训练样本;

43、训练单元,用于利用训练样本及算法标识对应的训练程序,训练预测模型;

44、交互界面生成单元,用于根据所述输入参数标识生成交互界面,发送交互界面至客户端显示;

45、预测单元,用于接收用户通过交互界面输入的待分析客户的特征信息,将待分析客户的特征信息输入至预测模型中得到预测结果,发送预测结果至客户端显示。

46、本文第三方面提供一种本文档来自技高网...

【技术保护点】

1.一种数据挖掘全流程方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,还包括:

3.如权利要求1所述的方法,其特征在于,发送预测结果至客户端显示时还包括:

4.如权利要求1所述的方法,其特征在于,利用预先建立的交易场景词典对获取的客户交易流水信息进行分析,生成客户的交易场景还原特征包括:

5.如权利要求1所述的方法,其特征在于,还包括:建立模型信息与交互界面间的关联关系;

6.如权利要求1所述的方法,其特征在于,根据所述文件标识、输入参数标识、输出参数标识及预处理信息,从数据库中获取训练样本包括:

7.如权利要求1所述的方法,其特征在于,所述模型训练配置界面包括:模板选择控件及文件选择控件;

8.一种数据挖掘全流程装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任意一项所述方法。

10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机设备的处理器执行时实现权利要求1至7任意一项所述方法。

...

【技术特征摘要】

1.一种数据挖掘全流程方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,还包括:

3.如权利要求1所述的方法,其特征在于,发送预测结果至客户端显示时还包括:

4.如权利要求1所述的方法,其特征在于,利用预先建立的交易场景词典对获取的客户交易流水信息进行分析,生成客户的交易场景还原特征包括:

5.如权利要求1所述的方法,其特征在于,还包括:建立模型信息与交互界面间的关联关系;

6.如权利要求1所述的方法,其特征在于,根据所述文件标识、输入参数标识、输出参数标识...

【专利技术属性】
技术研发人员:孙杨博夏全龙罗彬叶超
申请(专利权)人:交通银行股份有限公司北京市分行
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1