一种基于舆情数据的企业流失性风险预警系统和方法技术方案

技术编号:25837853 阅读:20 留言:0更新日期:2020-10-02 14:18
本发明专利技术涉及一种基于舆情数据的企业流失性风险预警方法,其包括的步骤有,采集步骤:采集企业舆情数据形成总样本,根据已流失的企业数量占总体企业数量比例的形成负样本;模型运算步骤:根据所述负样本的比较结果,在企业流失性预测模型算法库中选择一个多维预警模型进行模型运算;预警步骤:输出企业流失性风险预警结果。本发明专利技术的基于舆情数据的企业流失性风险预警方法的结果准确率较高、系统运行鲁棒性较好。

【技术实现步骤摘要】
一种基于舆情数据的企业流失性风险预警系统和方法
本专利技术属于基于特定数学模式的计算机系统领域,特别涉及一种基于舆情数据的企业流失性风险预警系统和方法。
技术介绍
企业流失性风险的预警系统目前尚未有报道,中国专利CN109523153A公开了一种非法集资企业的获取方法、装置、计算机设备和存储介质,然而其不能对企业的流失性风险进行预警;CN107644375A公开了一种专家模型与机器学习模型融合的小商户信用评估方法,然而其不能根据企业流失性风险的数据样本的特点有针对性的进行预警。
技术实现思路
为了解决本专利技术所提出的技术问题,本专利技术一方面提供了基于舆情数据的企业流失性风险预警方法,其包括:采集步骤:采集企业舆情数据形成总样本,根据已流失的企业数量占总体企业数量比例的形成负样本;模型运算步骤:根据所述负样本的比较结果,在企业流失性预测模型算法库中选择一个多维预警模型进行模型运算;预警步骤:输出企业流失性风险预警结果。本专利技术的另外一方面还提供了基于舆情数据的企业流失性风险预警系统,其特征在于,所述系统包括至少一个数据处理器;以及存储器,其存储有指令,当通过至少一个处理器来执行该指令时,实施本专利技术的预警方法。本专利技术的有益效果在于,本专利技术的基于舆情数据的企业流失性风险预警方法的结果准确率较高、系统运行鲁棒性较好。本专利技术基于舆情数据进行分析,能够达到秒级监测预警,系统实时性好。解决了监测部门对所辖企业的监测难以实时感知、关联、分析、决策的问题。附图说明图1.预测分析示意图;具体实施方式本专利技术的一些实施例中,基于舆情数据的企业流失性风险预警方法,包括如下步骤:采集步骤:采集企业舆情数据形成总样本,根据已流失的企业数量占总体企业数量比例的形成负样本;模型运算步骤:根据所述负样本的比较结果,在企业流失性预测模型算法库中选择一个多维预警模型进行模型运算;预警步骤:输出企业流失性风险预警结果。本专利技术的一些实施例中,所述采集步骤中,将采集的所述企业舆情数据先执行自然语言识别算法进行分类分析和内容分析获得舆情多维数据,所述舆情多维数据包括分支机构建立、项目落地、异地招聘。本专利技术的一些实施例中,所述企业流失性预测模型组包括二分类模型、回归模型、时间序列模型或专家模型中的两种或两种以上。本专利技术的一些实施例中,当负样本较多时,采用二分类模型和/或回归模型进行模型运算;当负样本较多且企业成立时间较长时,采用时间序列模型;当不满足上述条件时,采用专家模型。本专利技术的一些实施例中,专家模型是一种定性描述定量化方法,首先根据评价对象的具体要求选定若干个评价项目,再根据评价项目制订出评价标准,聘请若干代表性专家凭借自己的经验按此评价标准给出各项目的评价分值,然后对其进行结集;根据各指标对象主体的相对重要性,分别确定其权数,且权数之和为1;将每个指标划分多个等级,并为各等级赋予定量数值,用与判断对象的各指标在业务活动中所占等级;每一个等级对应一个分值;这样,每一个权数刚好对应一个等级的分值;将每项指标权数与对应的等级分别相乘,求出该指标得分;各项指标得分之和即为总分。本专利技术的一些实施例中,所述多维预警模型的维度包括企业经营、企业财务、企业舆情、企业招聘和宏观经济。本专利技术的一些实施例中,所述企业经营的指标包括:缴税金额、三级税收贡献、税务稽查处罚信息、社保缴纳人数;所述企业财务的指标包括:含营业收入总额、投资收益、利润总额、从业人员平均数等指标;所述企业舆情的指标包括:含正向评价次数、负面评价次数等指标;所述企业招聘的指标包括:含招聘区域、招聘人数、招聘薪资、更新次数等指标;所述宏观经济的指标包括:含地区生产总值、增长率、资产总计等。下面的具体实施例进一步对本专利技术进行说明。通过对舆情数据的自然语言识别算法,对舆情数据进行分类分析,通过分类及内容的分析,形成分支机构建立、项目落地、异地招聘等多个维度的十几个指标,通过模型运算给出企业流失的可能性分析。设计原理企业流失性预测模型根据负样本,即已流失的企业数量占总体企业的比例,选择不同的模型。既可以选择二分类模型、也可采用回归模型、时间序列模型或专家模型。负样本较少的情况,不宜采用二分类模型和回归模型;企业成立时间较短,不宜采用时间序列模型。综合考虑,专家模型更为通用(本节重点介绍)。如果数据允许,可以参照定制算法库的算法直接应用模型。设计思路企业流失性预测模型的分析维度包括:企业经营、企业财务、企业舆情、企业招聘和宏观经济。1)企业经营:含缴税金额、三级税收贡献、税务稽查处罚信息、社保缴纳人数等指标。2)企业财务:含营业收入总额、投资收益、利润总额、从业人员平均数等指标。3)企业舆情:含正向评价次数、负面评价次数等指标。4)企业招聘:含招聘区域、招聘人数、招聘薪资、更新次数等指标。5)宏观经济:含地区生产总值、增长率、资产总计等。模型设计专家模型是一种定性描述定量化方法,首先根据评价对象的具体要求选定若干个评价项目,再根据评价项目制订出评价标准,聘请若干代表性专家凭借自己的经验按此评价标准给出各项目的评价分值,然后对其进行结集。根据各指标对象主体的相对重要性,分别确定其权数,且权数之和为1。将每个指标划分多个等级,并为各等级赋予定量数值,用与判断对象的各指标在业务活动中所占等级。每一个等级对应一个分值。这样,每一个权数刚好对应一个等级的分值。将每项指标权数与对应的等级分别相乘,求出该指标得分。各项指标得分之和即为总分。1.选取n个维度,m个指标,则xij为第i个维度的第j个指标的数值(i=1,2…,n;j=1,2,…,m);2.指标的归一化处理:异质指标同质化由于各项指标的计量单位并不统一,因此在用它们计算综合指标前,先要对它们进行标准化处理,即把指标的绝对值转化为相对值,并令xij=|xij|,从而解决各项不同质指标值的同质化问题。而且,由于正向指标和负向指标数值代表的含义不同(正向指标数值越高越好,负向指标数值越低越好),因此,对于高低指标我们用不同的算法进行数据标准化处理。其具体方法如下:正向指标:x′ij=/fracxij-/min/xij,/cdots,xnj//max/x1j,/cdots,xnj/-/min/x1j,/cdots,xnj/负向指标:x′ij=/frac/max/x1j,/cdots,xnj/-xij/max/x1j,/cdots,xnj/-/min/xij,/cdots,xnj/则x′ij为第i个维度的第j个指标的数值(i=1,2…,n;j=1,2,…,m)。为了方便起见,归一化后的数据仍记为xij;3.计算第j项指标下第i个维度占该指标的比重:4.计算第j项指标的熵值:其中k=1/ln(本文档来自技高网...

【技术保护点】
1.一种基于舆情数据的企业流失性风险预警方法,其特征在于,/n采集步骤:采集企业舆情数据形成总样本,根据已流失的企业数量占总体企业数量比例的形成负样本;/n模型运算步骤:根据所述负样本的比较结果,在企业流失性预测模型算法库中选择一个多维预警模型进行模型运算;/n预警步骤:输出企业流失性风险预警结果。/n

【技术特征摘要】
1.一种基于舆情数据的企业流失性风险预警方法,其特征在于,
采集步骤:采集企业舆情数据形成总样本,根据已流失的企业数量占总体企业数量比例的形成负样本;
模型运算步骤:根据所述负样本的比较结果,在企业流失性预测模型算法库中选择一个多维预警模型进行模型运算;
预警步骤:输出企业流失性风险预警结果。


2.如权利要求1所述的方法,其特征在于,所述采集步骤中,
将采集的所述企业舆情数据先执行自然语言识别算法进行分类分析和内容分析获得舆情多维数据,所述舆情多维数据包括分支机构建立、项目落地、异地招聘。


3.如权利要求2所述的方法,其特征在于,所述企业流失性预测模型组包括二分类模型、回归模型、时间序列模型或专家模型中的两种或两种以上。


4.如权利要求3所述的方法,其特征在于,
当负样本较多时,采用二分类模型和/或回归模型进行模型运算;
当负样本较多且企业成立时间较长时,采用时间序列模型;
当不满足上述条件时,采用专家模型。


5.如权利要求4所述的方法,其特征在于,
专家模型是一种定性描述定量化方法,首先根据评价对象的具体要求选定若干个评价项目,再根据评价项目制订出评价标准,聘请若干代表性专家凭借自己的经验按此评价标准给...

【专利技术属性】
技术研发人员:朱志伟刘炳文
申请(专利权)人:金电联行北京信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1