企业经营健康度评估方法、模型构建方法和装置制造方法及图纸

技术编号:39394813 阅读:12 留言:0更新日期:2023-11-19 15:49
本申请涉及一种企业经营健康度评估方法、模型构建方法和装置,其中,该模型构建方法包括:对企业的原始基础数据进行加工,得到多维度特征;对多维度特征进行样本处理,选取出续费企业样本和流失企业样本的高维度特征;对高维度特征进行特征变换选择,以确定最优特征组合;将最优特征组合划分成训练集和测试集,以续费企业和流失企业作为有监督模型训练学习的二分类目标,结合预设的各分段续费率,以构建量化评估模型。通过本申请,解决了企业经营健康度的难以量化评估或评估准确率不高、结果稳定性较低或可解释较差的业界技术问题,实现了对企业经营健康度量化评估结果的准确稳定和鲁棒性能,显著提升了企业经营状况的识别效率和整体续费率。率和整体续费率。率和整体续费率。

【技术实现步骤摘要】
企业经营健康度评估方法、模型构建方法和装置


[0001]本申请涉及企业评估
,特别是涉及企业经营健康度评估方法、模型构建方法和装置。

技术介绍

[0002]在面向企业(to B)提供服务的领域,需要洞察服务企业经营的状况和健康度,从而进行更精细化、个性化的服务运营动作,以提升服务企业体验粘性和运营效率。尤其是SaaS企业服务领域,续费率是极为关键的指标,量化评估并准确预测服务企业经营的健康度,直接决定了to B企业整体续费率。
[0003]目前对于企业经营健康度评估大致分为两种。
[0004]一种是基于业务经验打分的方案,该方案主要以企业经营的商品交易总额(Gross Merchandise Volume,GMV)作为健康度的指标。该方案的缺点在于,企业经营状况是否健康受很多因素影响,根据单一指标维度来判定,评估企业经营的健康度的准确率较低。
[0005]另外一种是基于无监督学习模型的方案,该类方案是通过不同维度构建K

means、DBscan等聚类算法,以“物以类聚,人以群分”的无监督方式对企业的原始基础数据进行训练,以划分出健康程度等级的企业群。该类方案的缺点在于,企业的经营健康状况无法综合量化评估,只能做聚类分群,无法输出量化的评估结果。
[0006]针对相关技术中基于无监督学习模型的方案,基于企业的原始基础数据进行训练,只能做聚类分群,无法输出量化的评估结果,评估结果准确率不高的问题,目前还没有提出有效的解决方案。

技术实现思路

[0007]在本实施例中提供了一种企业经营健康度评估方法、模型构建方法和装置,以解决相关技术中基于企业的原始基础数据进行训练,只能做聚类分群,无法输出量化的评估结果,评估结果准确率不高的问题。
[0008]第一个方面,在本实施例中提供了一种模型构建方法,包括:
[0009]对企业的原始基础数据进行加工,得到多维度特征;
[0010]对所述多维度特征进行样本处理,选取出续费企业样本和流失企业样本的高维度特征;
[0011]对所述高维度特征进行特征变换选择,以确定最优特征组合;
[0012]将所述最优特征组合划分成训练集和测试集,以所述续费企业和所述流失企业作为训练学习的二分类目标变量,并结合预设的各分段续费率对有监督学习的原始网络模型进行训练学习,以构建量化评估模型。
[0013]在其中的一些实施例中,所述对所述多维度特征进行样本处理,选取出续费企业样本和流失企业样本的高维度特征,包括:
[0014]按预设的预处理规则,对所述多维度特征进行预处理;
[0015]对经过预处理的所述多维度特征进行样本处理,选取所述出续费企业样本和所述流失企业样本的高维度特征。
[0016]在其中的一些实施例中,所述对经过预处理的所述多维度特征进行样本处理,选取所述出续费企业样本和所述流失企业样本的高维度特征,包括:
[0017]按预设的筛选策略对经过预处理的所述多维度特征进行样本处理,选取所述出续费企业样本和所述流失企业样本的高维度特征;
[0018]所述筛选策略包括服务年限阈值和企业类型样本划分原则。
[0019]在其中的一些实施例中,所述对所述高维度特征进行特征变换选择,以确定最优特征组合,包括:
[0020]对所述高维度特征进行特征初筛,得到初筛特征;
[0021]利用特征使用模型,对所述初筛特征进行最优选择,得到最优特征组合。
[0022]在其中的一些实施例中,所述对所述高维度特征进行特征初筛,得到初筛特征,包括:
[0023]利用卡方分箱,对所述高维度特征进行分组处理,并确定第一分组特征和对应的最优分组阈值;
[0024]利用证据权重编码,对各组所述第一分组特征的最优分组阈值进行转换,并基于预设的信息值从所述第一分组特征中选取出第二分组特征;
[0025]对所述第二分组特征进行多特征相关性筛选分析和评估稳定性,得到初筛特征。
[0026]在其中的一些实施例中,所述方法还包括:
[0027]基于所述量化评估模型输出的每个特征在经营健康度的影响权重,确定健康分与预测概率的表达式。
[0028]在其中的一些实施例中,所述健康分与预测概率的表达式为:
[0029][0030]其中,Score表示健康分;p表示预测概率;A和B表示常数。
[0031]第二个方面,在本实施例中提供了一种企业经营健康度评估方法,包括:
[0032]利用如第一个方面中任一项所述的模型构建方法构建的量化评估模型,对待分析企业的原始基础数据进行量化评估,得到所述待分析企业的量化评估结果。
[0033]在其中的一些实施例中,所述方法还包括:
[0034]将所述量化评估结果输入到健康分与预测概率的表达式中,得到所述待分析企业的经营健康得分及健康度。
[0035]第三个方面,在本实施例中提供了一种模型构建装置,包括:加工模块、样本处理模块、特征变换选择模块以及训练学习模块;
[0036]所述加工模块,用于对企业的原始基础数据进行加工,得到多维度特征;
[0037]所述样本处理模块,用于对所述多维度特征进行样本处理,选取出续费企业样本和流失企业样本的高维度特征;
[0038]所述特征变换选择模块,用于对所述高维度特征进行特征变换选择,以确定最优特征组合;
[0039]所述训练学习模块,用于将所述最优特征组合划分成训练集和测试集,以所述续
费企业和所述流失企业作为训练学习的二分类目标变量,并结合预设的各分段续费率对有监督学习的原始网络模型进行训练学习,以构建量化评估模型。
[0040]第四个方面,在本实施例中提供了一种企业经营健康度评估装置,包括:量化评估模块;
[0041]所述量化评估模块,用于利用如第一个方面中任一项所述的模型构建方法构建的量化评估模型,对待分析企业的原始基础数据进行量化评估,得到所述待分析企业的量化评估结果。
[0042]第五个方面,在本实施例中提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的模型构建方法;或,实现上述第二个方面所述的企业经营健康度评估方法。
[0043]第六个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的模型构建方法;或,实现上述第二个方面所述的企业经营健康度评估方法。
[0044]与相关技术相比,在本实施例中提供的企业经营健康度评估方法、模型构建方法和装置。其中,模型构建方法,通过对企业的原始基础数据进行加工,得到多维度特征;对多维度特征进行样本处理,选取出续费企业样本和流失企业样本的高维度特征;对高维度特征进行特征变换选择,以确定最优特征组合;将最优特征组合划分成训练集和测试集,以续费企业和流失企业作为训练学本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型构建方法,其特征在于,包括:对企业的原始基础数据进行加工,得到多维度特征;对所述多维度特征进行样本处理,选取出续费企业样本和流失企业样本的高维度特征;对所述高维度特征进行特征变换选择,以确定最优特征组合;将所述最优特征组合划分成训练集和测试集,以所述续费企业和所述流失企业作为训练学习的二分类目标变量,并结合预设的各分段续费率对有监督学习的原始网络模型进行训练学习,以构建量化评估模型。2.根据权利要求1所述的模型构建方法,其特征在于,所述对所述多维度特征进行样本处理,选取出续费企业样本和流失企业样本的高维度特征,包括:按预设的预处理规则,对所述多维度特征进行预处理;对经过预处理的所述多维度特征进行样本处理,选取所述出续费企业样本和所述流失企业样本的高维度特征。3.根据权利要求2所述的模型构建方法,其特征在于,所述对经过预处理的所述多维度特征进行样本处理,选取所述出续费企业样本和所述流失企业样本的高维度特征,包括:按预设的筛选策略对经过预处理的所述多维度特征进行样本处理,选取所述出续费企业样本和所述流失企业样本的高维度特征;所述筛选策略包括服务年限阈值和企业类型样本划分原则。4.根据权利要求1至3任一项所述的模型构建方法,其特征在于,所述对所述高维度特征进行特征变换选择,以确定最优特征组合,包括:对所述高维度特征进行特征初筛,得到初筛特征;利用特征使用模型,对所述初筛特征进行最优选择,得到最优特征组合。5.根据权利要求4所述的模型构建方法,其特征在于,所述对所述高维度特征进行特征初筛,得到初筛特征,包括:利用卡方分箱,对所述高维度特征进行分组处理,并确定第一分组特征和对应的最优分组阈值;利用证据权重编码,对各组所述第一分组特征的最优分组阈值进行转换,并基于预设的信息值从所述第一分组特征中选取出第二分组特征;对所述第二分组特征进行多特征相关性筛选分析和评估稳定性,得到初筛特征。6.根据权利要求4所述的模型构建方法,其特征在于,所述方法还包括:基于所述量化评估模型输出的每个特征在经营健康度的影响权重,确定健康分与预测概率的表...

【专利技术属性】
技术研发人员:刘纪稳
申请(专利权)人:杭州有赞科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1