基于客户退单预警的订单数据处理方法、装置制造方法及图纸

技术编号:24458639 阅读:53 留言:0更新日期:2020-06-10 16:19
本发明专利技术公开了一种基于客户退单预警的订单数据处理方法、装置、计算机设备和存储介质,通过计算训练数据集D的信息经验熵,计算各类特征属性的条件熵,计算各类特征属性的信息增益值,将信息增益值的一类特征属性确定为决策树的根节点,形成树形结构,记录树形结构的形成顺序,剔除训练数据集D中当前信息增益值的一类特征属性,形成新的训练数据集D,返回计算训练数据集D的信息经验熵的过程,以依次得到多个树形结构,直至所得到的树形结构对应的信息增益值小于增益阈值,再根据树形结构的形成顺序将各个树形结构组合为决策树,得到预测模型,采用预测模型检测待测订单信息的退单风险,可以简化退单风险的检测过程,提高检测效率。

Order data processing method and device based on customer return alert

【技术实现步骤摘要】
基于客户退单预警的订单数据处理方法、装置
本专利技术涉及数据结构
,尤其涉及一种基于客户退单预警的订单数据处理方法、装置、计算机设备和存储介质。
技术介绍
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。客户退单预测预警对于企业维系和挽留高价值用户具有非常重要的意义,在电信、游戏、互联网零售等行业已经有了不少的应用,而互联网家装领域刚从传统行业转型,客户的退单问题一直是家装公司的痛点所在,缺乏有效的预测预警,不能提前开展针对性的挽留措施是其中一个重要的原因。本专利技术将提供一种通过自动采集数据,提取特征属性,通过ID3算法分析,创建决策树模型训练学习,并自动分析现网现有数据,提前采取针对性的挽回措施,减小客户退单率,降低公司该类成本,提升客户满意度的同时提升公司效益。基于传统的订单数据处理方案进行相关订单管理的过程中,想要预估客户退单风险,需要调查和整合在各个阶段为客户提供服务的人员提供的信息,如接触阶段,意向阶段,设计阶段等,工作繁重且预估偏主观,本文档来自技高网...

【技术保护点】
1.一种基于客户退单预警的订单数据处理方法,其特征在于,包括如下步骤:/nS10,计算训练数据集D的信息经验熵;其中,所述训练数据集D包括多个样本数据;各个样本数据包括多个特征属性;/nS20,识别训练数据集D中的各类特征属性,计算各类特征属性的条件熵,根据信息经验熵和各类特征属性的条件熵计算各类特征属性的信息增益值;/nS30,将信息增益值的一类特征属性确定为决策树的根节点,形成树形结构,记录树形结构的形成顺序;/nS40,剔除训练数据集D中当前信息增益值的一类特征属性,形成新的训练数据集D,返回步骤S10,以依次得到多个树形结构,直至所得到的树形结构对应的信息增益值小于增益阈值;/nS50...

【技术特征摘要】
1.一种基于客户退单预警的订单数据处理方法,其特征在于,包括如下步骤:
S10,计算训练数据集D的信息经验熵;其中,所述训练数据集D包括多个样本数据;各个样本数据包括多个特征属性;
S20,识别训练数据集D中的各类特征属性,计算各类特征属性的条件熵,根据信息经验熵和各类特征属性的条件熵计算各类特征属性的信息增益值;
S30,将信息增益值的一类特征属性确定为决策树的根节点,形成树形结构,记录树形结构的形成顺序;
S40,剔除训练数据集D中当前信息增益值的一类特征属性,形成新的训练数据集D,返回步骤S10,以依次得到多个树形结构,直至所得到的树形结构对应的信息增益值小于增益阈值;
S50,根据树形结构的形成顺序将各个树形结构组合为决策树,得到预测模型,在预测模型的预测错误率小于错误率阈值时,采用预测模型检测待测订单信息的退单风险。


2.根据权利要求1所述的基于客户退单预警的订单数据处理方法,其特征在于,在一个实施方式中,采用预测模型检测待测订单信息的退单风险包括:
将待测订单信息输入预测模型,获取预测模型输出的退单风险预测结果;若退单风险预测结果为退单,获取引起退单的风险特征,根据所述风险特征生成客户挽回策略。


3.根据权利要求1所述的基于客户退单预警的订单数据处理方法,其特征在于,在一个实施方式中,根据树形结构的形成顺序将各个树形结构组合为决策树,得到预测模型,在预测模型的预测错误率小于错误率阈值时,采用预测模型检测待测订单信息的退单风险之后,还包括:
定期记录预警模型推送的各个预测结果,检测各个预测结果与实际情况不一致的次数,若在一个检测周期内不一致的次数超过次数阈值,输出预警模型的错误标志信息。


4.根据权利要求1所述的基于客户退单预警的订单数据处理方法,其特征在于,在一个实施方式中,训练数据集D的信息经验熵的计算过程包括:



其中,H(D)表示训练数据集D的信息经验熵,|D|表示训练数据集D的样本容量,训练数据集D包括n类特征属性,xi表示训练数据集D中第i类特征属性的个数,i=1,2,3,···,n。


5.根据权利要求4所述的基于客户退单预警的订单数据处理方法,其特征在于,在一个实施方式中,条件熵的计算过程包括:



其中,H...

【专利技术属性】
技术研发人员:陈旋王冲张平李广宇
申请(专利权)人:江苏艾佳家居用品有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1