一种经营主体的经营分析预测评估系统技术方案

技术编号:22468729 阅读:14 留言:0更新日期:2019-11-06 12:09
本发明专利技术公开了一种经营主体的经营分析预测评估系统,利用公开的数据和授权数据,具体指将电商平台、支付平台、财务数据、税务数据和用电用水等数据进行整合,在该整合后的数据集基础上进行建模。根据历史营收数据,分别建立时间序列模型和xgboost回归模型;历史营收数据较多的企业,采用时间序列模型,包括:进行时间序列的预处理,使数据平稳化和随机化;Xgboost回归模型即对基期的指标预测当期的营收。接着对营收预测结果进行了一系列分析。最后再结合预测的营收、财务数据和家庭收入,计算流动比率、速动比率等来评估企业的偿还能力,并给出合理还款能力范围。

A business analysis, prediction and evaluation system for business subjects

【技术实现步骤摘要】
一种经营主体的经营分析预测评估系统
本专利技术属于预测评估领域,涉及经营分析技术,具体是一种经营主体的经营分析预测评估系统。
技术介绍
由于小微企业的运营时间较短,在经济市场中扎根不深,信息披露少,并且企业的财务报表真实性有待考量,小微企业和个体工商户内部管理制度也不够成熟,并且缺乏相应的偿还能力,从而大大提高了经营风险,同时也提高了商业银行信贷风险。因此下一期的经营业绩进行预测,评估企业的偿还能力显得很有必要。所谓贷款偿还能力是指借款人按期全额清偿商业银行贷款本金和利息的能力。为了能够全面加强信贷风险控制力度,本申请利用大数据技术,全面对企业的经营情况进行分析。小微企业、工商户涉足的行业众多,所处的行业不同,资金需求也不尽相同。其行业分散导致的资金需求差异性大;资金需求时效性要求高;资金需求的真实信息不易掌握;;缺少有效、足值抵押品进行担保;经营规模较小、实力相对较弱,资本金较少,不能通过提供抵押品来担保增信,所以大量小微企业、工商户很难从银行渠道获得有效的信贷支持,导致其发展缓慢,抵抗外部环境变化的能力较差,经营风险高。
技术实现思路
本专利技术的目的在于提供一种经营主体的经营分析预测评估系统。本专利技术的目的可以通过以下技术方案实现:一种经营主体的经营分析预测评估系统,包括数据收集模块、模型建立单元、数据分析单元、处理器、显示单元、存储单元和管理单元;其中,所述数据收集模块用于收集目标用户的基础数据,所述基础数据包括财务报表、线上交易数据、线上评价数据、支付数据、税务数据和水电数据;财务报表为规范的财务数据,包括资产负债表、利润表和现金流量表;线上交易数据为通过电商交易平台的交易数据,线上评价数据为对电商交易平台的交易数据的评价;支付数据为通过支付宝或者微信等支付平台的支付数据;水电数据为该目标用户的每月用水用电数据;所述模型建立单元用于根据基础数据建立时间序列模型和xgboost回归模型;所述数据分析单元用于结合模型建立单元对基础数据进行特征分析处理,得到新的特征值并将该值标记为相关特征值,之后对相关特征值进行预测处理;将指标值和应变量进行相关性分析,应变量为营收,剔除相关性很弱的指标;通过python工具对训练数据,也就是前述的自变量即基础数据加上应变量即营收数据;具体处理步骤如下:步骤一:对基础数据进行特征筛选;具体通过sklearn库中的RFECV来选择,之后进行RF计算因子重要性与排名,统计因子重要性百分比与准确率、数据量的关系并绘图;步骤二:对缺失值进行处理,首先去除缺失值大于90%的特征,对于缺失值低于90%的特征,则采用平均值或众数来替代缺失值;步骤三:通过python工具进行极值处理;步骤四:特殊时期处理,找出周均值的方差大于阈值的商家,直接删除波动过大的时段数据;过大指代此时预设时间段均值超过预设值;步骤五:构造特征,数据滑窗,增加前几个季度的营收;通过比率滑窗得到环比和同比;从而得到相关特征值;步骤六:调用python里面自带的模块包,传入数据,构建算法模型,据企业的历史数据量,历史营收数据值较多,且营收时序图较为稳定的行业,则采用了时间序列模型,预测下一期的营收,较多定义为八期及以上的营收数据;历史营收数据值较少时,较少定义为八期以下的营收数据,分别采用了机器学习算法随机森林、lightgbm、xgboost,用基期的指标值去构建回归模型,拟合当期的营收值;步骤七:对模型进行优化,采用了滑窗训练和三折交叉验证方法进行优化;步骤八:形成营收趋势图、同比波动趋势图等,将营收趋势图、同比波动趋势图标定为预测数据;所述管理单元用于用户录入每月还款金额;所述数据收集模块还用于获取目标用户的平均现金流入和平均现金流出;所述数据分析单元用于将预测数据传输到处理器;所述处理器用于根据预测数据获取到预测的营收和家庭收入并进行偿还能力分析得到分析结果;所述处理器用于将分析结果传输到显示单元进行实时显示,所述处理器用于将分析结果传输到存储单元进行实时存储。进一步地,所述基础数据通过网站爬取和授权得到。进一步地,所述历史营收数据为公司一到n期的经营业绩指标,是应变量;经过特征分析处理之后得到的相关特征值是自变量。进一步地,特征分析处理步骤七模型优化过程中,还将自变量值进行了归一化处理,其中归一化处理指的是x*=(x-x_mean)/(x_max-x_min),x_mean表示数据的均值,x就是一系列的自变量值;即将有量纲的表达式,经过变换,化为无量纲的表达式,成为标量。进一步地,所述家庭收入为企业主的家庭收入;具体偿还能力分析步骤为:步骤一:获取到预测的营收、家庭收入、目标用户的平均现金流入、平均现金流出和每月还款金额;步骤二:将上述数据代入条件一和条件二:条件一:目标用户的家庭平均现金流入-目标用户的平均现金流出>=每月还款金额条件二:合理还款能力=(预测的营收+家庭收入)×指定占比,指定占比为40%~50%;只有同时满足条件一和条件二,才能判定具备还款能力;且每月还款金额小于等于合理还款能力;步骤三:得到分析结果。本专利技术的有益效果:本申请所提供的的小微企业经营业绩预测的方法,利用公开的数据和授权数据,具体指将电商平台、支付平台、财务数据、税务数据和用电用水等数据进行整合,在该整合后的数据集基础上进行建模。根据历史营收数据,分别建立时间序列模型和xgboost回归模型;历史营收数据较多的企业,采用时间序列模型,包括:进行时间序列的预处理,使数据平稳化和随机化;Xgboost回归模型即对基期的指标预测当期的营收。接着对营收预测结果进行了一系列分析。最后再结合预测的营收、财务数据和家庭收入,计算流动比率、速动比率等来评估企业的偿还能力,并给出合理还款能力范围;本专利技术简单有效,且易于实用。附图说明为了便于本领域技术人员理解,下面结合附图对本专利技术作进一步的说明。图1为本专利技术的系统框图;图2为财务报表数据示例。具体实施方式如图1所示,一种经营主体的经营分析预测评估系统,包括数据收集模块、模型建立单元、数据分析单元、处理器、显示单元、存储单元和管理单元;其中,所述数据收集模块用于收集目标用户的基础数据,所述基础数据包括财务报表、线上交易数据、线上评价数据、支付数据、税务数据和水电数据;如图2所示,财务报表为规范的财务数据,包括资产负债表、利润表和现金流量表;线上交易数据为通过电商交易平台的交易数据,线上评价数据为对电商交易平台的交易数据的评价;支付数据为通过支付宝或者微信等支付平台的支付数据;水电数据为该目标用户的每月用水用电数据;所述模型建立单元用于根据基础数据建立时间序列模型和xgboost回归模型;所述数据分析单元用于结合模型建立单元对基础数据进行特征分析处理,得到新的特征值并将该值标记为相关特征值,其中基础数据通过网站爬取和授权得到;将指标值和应变量“营收”进行相关性分析,剔除相关性很弱的指标;通过python工具对训练数据,也就是前述的自变量即基础数据(交易数据评价数据等)加上应变量即营收数据,对这些训练数据进行下述步骤一到步骤五的特征分析处理;具体处理步骤如下:步骤一:对基础数据进行特征筛选;具体通过sklearn库中的RFECV来选择,之后进行RF计算因子重要性与排名,统计因子重要性百分本文档来自技高网...

【技术保护点】
1.一种经营主体的经营分析预测评估系统,其特征在于,包括数据收集模块、模型建立单元、数据分析单元、处理器、显示单元、存储单元和管理单元;其中,所述数据收集模块用于收集目标用户的基础数据,所述基础数据包括财务报表、线上交易数据、线上评价数据、支付数据、税务数据和水电数据;财务报表为规范的财务数据,包括资产负债表、利润表和现金流量表;线上交易数据为通过电商交易平台的交易数据,线上评价数据为对电商交易平台的交易数据的评价;支付数据为通过支付宝或者微信等支付平台的支付数据;水电数据为该目标用户的每月用水用电数据;所述模型建立单元用于根据基础数据建立时间序列模型和xgboost回归模型;所述数据分析单元用于结合模型建立单元对基础数据进行特征分析处理,得到新的特征值并将该值标记为相关特征值,之后对相关特征值进行预测处理;将指标值和应变量进行相关性分析,应变量为营收,剔除相关性很弱的指标;通过python工具对训练数据,也就是前述的自变量即基础数据加上应变量即营收数据;具体处理步骤如下:步骤一:对基础数据进行特征筛选;具体通过sklearn库中的RFECV来选择,之后进行RF计算因子重要性与排名,统计因子重要性百分比与准确率、数据量的关系并绘图;步骤二:对缺失值进行处理,首先去除缺失值大于90%的特征,对于缺失值低于90%的特征,则采用平均值或众数来替代缺失值;步骤三:通过python工具进行极值处理,将指标值大于99.9%或小于0.1%的值改为99.9%或0.1%位置的值;步骤四:特殊时期处理,找出预测时间段的方差大于阈值的商家,直接删除波动过大的时段数据;过大指代此时预设时间段的均值超过预设值;步骤五:构造特征,数据滑窗,增加前几个季度的营收;通过比率滑窗得到环比和同比;从而得到相关特征值;步骤六:调用python里面自带的模块包,传入数据,构建算法模型,据企业的历史数据量,历史营收数据值较多,且营收时序图较为稳定的行业,则采用了时间序列模型,预测下一期的营收,较多定义为八期及以上的营收数据;历史营收数据值较少时,较少定义为八期以下的营收数据,分别采用了机器学习算法随机森林、lightgbm、xgboost,用基期的指标值去构建回归模型,拟合当期的营收值;步骤七:对模型进行优化,采用了滑窗训练和三折交叉验证方法进行优化;步骤八:形成营收趋势图、同比波动趋势图等,将营收趋势图、同比波动趋势图标定为预测数据;所述管理单元用于用户录入每月还款金额;所述数据收集模块还用于获取目标用户的平均现金流入和平均现金流出;所述数据分析单元用于将预测数据传输到处理器;所述处理器用于根据预测数据获取到预测的营收和家庭收入并进行偿还能力分析得到分析结果;所述处理器用于将分析结果传输到显示单元进行实时显示,所述处理器用于将分析结果传输到存储单元进行实时存储。...

【技术特征摘要】
1.一种经营主体的经营分析预测评估系统,其特征在于,包括数据收集模块、模型建立单元、数据分析单元、处理器、显示单元、存储单元和管理单元;其中,所述数据收集模块用于收集目标用户的基础数据,所述基础数据包括财务报表、线上交易数据、线上评价数据、支付数据、税务数据和水电数据;财务报表为规范的财务数据,包括资产负债表、利润表和现金流量表;线上交易数据为通过电商交易平台的交易数据,线上评价数据为对电商交易平台的交易数据的评价;支付数据为通过支付宝或者微信等支付平台的支付数据;水电数据为该目标用户的每月用水用电数据;所述模型建立单元用于根据基础数据建立时间序列模型和xgboost回归模型;所述数据分析单元用于结合模型建立单元对基础数据进行特征分析处理,得到新的特征值并将该值标记为相关特征值,之后对相关特征值进行预测处理;将指标值和应变量进行相关性分析,应变量为营收,剔除相关性很弱的指标;通过python工具对训练数据,也就是前述的自变量即基础数据加上应变量即营收数据;具体处理步骤如下:步骤一:对基础数据进行特征筛选;具体通过sklearn库中的RFECV来选择,之后进行RF计算因子重要性与排名,统计因子重要性百分比与准确率、数据量的关系并绘图;步骤二:对缺失值进行处理,首先去除缺失值大于90%的特征,对于缺失值低于90%的特征,则采用平均值或众数来替代缺失值;步骤三:通过python工具进行极值处理,将指标值大于99.9%或小于0.1%的值改为99.9%或0.1%位置的值;步骤四:特殊时期处理,找出预测时间段的方差大于阈值的商家,直接删除波动过大的时段数据;过大指代此时预设时间段的均值超过预设值;步骤五:构造特征,数据滑窗,增加前几个季度的营收;通过比率滑窗得到环比和同比;从而得到相关特征值;步骤六:调用python里面自带的模块包,传入数据,构建算法模型,据企业的历史数据量,历史营收数据值较多,且营收时序图较为稳定的行业,则采用了时间序列模型,预测下一期的营收,较多定义为八期及以上的营收数据;历史营收数据值较少时,较少定义为八期...

【专利技术属性】
技术研发人员:张小花
申请(专利权)人:安徽迪科数金科技有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1