一种数据处理方法、系统及相关设备技术方案

技术编号:24010906 阅读:29 留言:0更新日期:2020-05-02 01:42
本发明专利技术实施例提供了一种数据处理方法、系统及相关设备,用于实现企业征信的自动化评分,减少了人为干预,提高企业风险评估准确性和可信度。本发明专利技术实施例中可以获取目标企业的准则层指标中包含的各个因素层指标对应的征信统计信息,并采用特征工程中的所有预设算法依次对每个维度的征信统计信息进行筛选,得到每个因素层指标的积分值,将积分值排序靠前的预设数量的因素层指标作为入模因素层指标,完成入模因素层指标的自动筛选,同时,采用层次分析算法根据准则层指标计的指标分数、入模因素层指标的积分值计算每个准则层指标的权重及每个入模因素层指标的权重。相对于现有技术,减少了人为干预,提高了风险评估的可信度。

A data processing method, system and related equipment

【技术实现步骤摘要】
一种数据处理方法、系统及相关设备
本专利技术涉及数据处理
,尤其涉及一种数据处理方法、系统及相关设备
技术介绍
征信业在中国从无到有,随着大数据时代的到来,征信业的发展更是突飞猛进,显然,企业征信制度可以解决一些信息不对称的问题,降低信息成本和交易成本,进而减轻逆向选择。征信体系能大规模高效率地收集、加工、处理交易的信息,尽可能降低交易过程中的不确定性,降低银行信息成本,也提高了银行贷款的质量。同时,企业征信制度使得中小企业的风险更加透明化,进而增加中小企业的融资机会。此外,企业征信制度还可以形成企业经营风险约束机制,企业征信风险评估制度为企业展示自身的经营风险水平和信誉提供了一个平台,企业会自发形成约束机制,倾向于披露真实信息,最终形成社会认可的信誉交易机制。企业征信风险评估制度的实现中,最重要的环节就是征信维度的选择及各个维度的权重值的确定。目前的企业征信风险评估系统采用的方法是专家打分法,基于预设维度人为分配权重,并计算各个维度的总得分值。现有方式,在建模的过程中,人工确定统计维度及各个维度的权重,加入了很大的主观性,无法保证企业经营风险评估的可信力。
技术实现思路
本专利技术实施例提供了一种数据处理方法、系统及相关设备,用于实现企业征信的自动化评分,减少了人为干预,提高企业征信评分准确性和可信度。本专利技术实施例第一方面提供了一种数据处理方法,可包括:获取目标企业的准则层指标中包含的各个因素层指标对应的征信统计信息,所述目标企业包含至少两个准则层指标,每一个准则层指标至少包含一个因素层指标;采用特征工程中的所有预设算法依次对每个维度的征信统计信息进行筛选,记录每个维度的征信统计信息对应的因素层指标的积分值,其中,所述特征工程中包含至少两种预设算法,当某一个维度的征信统计信息被一种预设算法选中时,对应的因素层指标的积分值加1;将积分值排序靠前的预设数量的因素层指标作为入模因素层指标,并记录每一个准则层指标的指标分数为其包含的所有入模因素层指标的积分值之和;采用层次分析算法根据准则层指标计的指标分数、入模因素层指标的积分值计算每个所述准则层指标的权重及每个入模因素层指标的权重;获取每个入模因素层指标对应的风险评分,并计算每个入模因素层指标对应的风险评分、入模因素层指标的权重以及入模因素层指标所属的准则层指标的权重三者的乘积,作为每一个入模因素层指标对应的准则层分数;根据所有入模因素层指标对应的准则层分数之和,计算所述目标企业的风险评估总分。可选的,作为一种可能的实施方式,本专利技术实施例中,所述根据所有入模因素层指标对应的准则层分数之和,计算所述目标企业的风险评估总分,包括:将所有入模因素层指标对应的准则层分数之和按预设比例缩放得到所述目标企业的风险评估总分。可选的,作为一种可能的实施方式,本专利技术实施例中,所述特征工程中包含的预设算法包括:决策树算法、方差筛选算法、皮尔逊显著性算法、递归特征消除算法、SAS决策树算法中的任意两种以上算法形成的组合。可选的,作为一种可能的实施方式,本专利技术实施例中的数据处理方法还可以包括:以数值或图表形式展示所述入模因素层指标对应的准则层分数,和/或所述目标企业的风险评估总分。可选的,作为一种可能的实施方式,本专利技术实施例中所述征信统计信息包括:涉税信息、工商信息、司法信息中的一种或多种;其中,所述涉税信息包括企业税务登记信息、股东信息、收入申报信息、税金逾期信息中的一种或多种;所述工商信息包括企业工商登记信息、股权信息、行政处罚信息中的一种或多种;所述司法信息包括企业涉诉裁判文书、失信执行信息、企业主限制高消费和出入境信息中的一种或多种。可选的,作为一种可能的实施方式,本专利技术实施例中的数据处理方法还可以包括:采集原始的企业样本数据,并对所述企业样本数据进行清洗,生成符合预设格式的征信统计信息。本专利技术实施例第二方面提供了一种数据处理系统,可包括:获取模块,获取目标企业的准则层指标中包含的各个因素层指标对应的征信统计信息,目标企业包含至少两个准则层指标,每一个准则层指标至少包含一个因素层指标;筛选模块,采用特征工程中的所有预设算法依次对每个维度的征信统计信息进行筛选,记录每个维度的征信统计信息对应的因素层指标的积分值,其中,特征工程中包含至少两种预设算法,当某一个维度的征信统计信息被一种预设算法选中时,对应的因素层指标的积分值加1;记录模块,用于将积分值排序靠前的预设数量的因素层指标作为入模因素层指标,并记录每一个准则层指标的指标分数为其包含的所有入模因素层指标的积分值之和;第一计算模块,采用层次分析算法根据准则层指标计的指标分数、入模因素层指标的积分值计算每个准则层指标的权重及每个入模因素层指标的权重;第二计算模块,用于获取每个入模因素层指标对应的风险评分,并计算每个入模因素层指标对应的风险评分、入模因素层指标的权重以及入模因素层指标所属的准则层指标的权重三者的乘积,作为每一个入模因素层指标对应的准则层分数;第三计算模块,用于根据所有入模因素层指标对应的准则层分数之和,计算目标企业的风险评估总分。可选的,作为一种可能的实施方式,本专利技术实施例中的第三计算模块还可以包括:计算单元,用于将所有入模因素层指标对应的准则层分数之和按预设比例缩放得到目标企业的风险评估总分。可选的,作为一种可能的实施方式,本专利技术实施例中的数据处理系统还可以包括:展示模块,用于以数值或图表形式展示入模因素层指标对应的准则层分数,和/或目标企业的风险评估总分。可选的,作为一种可能的实施方式,本专利技术实施例中的数据处理系统中,征信统计信息可以包括:涉税信息、工商信息、司法信息中的一种或多种;其中,涉税信息包括企业税务登记信息、股东信息、收入申报信息、税金逾期信息中的一种或多种;工商信息包括企业工商登记信息、股权信息、行政处罚信息中的一种或多种;司法信息包括企业涉诉裁判文书、失信执行信息、企业主限制高消费和出入境信息中的一种或多种。可选的,作为一种可能的实施方式,本专利技术实施例中的数据处理系统还可以包括:数据处理模块,用于采集原始的企业样本数据,并对企业样本数据进行清洗,生成符合预设格式的征信统计信息。本申请实施例第三方面提供了一种计算机装置,其特征在于,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如第一方面及第一方面中任意一种可能的实施方式中的步骤。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术实施例中,数据处理系统可以获取目标企业的准则层指标中包含的各个因素层指标对应的征信统计信息,并采用特征工程中的所有预设算法依次对每个维度的征信统计信息进行筛选,记录每个维度的征信统计信息对应的因素层指标的积分值,将积分值排序靠前的预设数量的因素层指标作为入模因素层指标,完成入模因素层指标本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取目标企业的准则层指标中包含的各个因素层指标对应的征信统计信息,所述目标企业包含至少两个准则层指标,每一个准则层指标至少包含一个因素层指标;/n采用特征工程中的所有预设算法依次对每个维度的征信统计信息进行筛选,记录每个维度的征信统计信息对应的因素层指标的积分值,其中,所述特征工程中包含至少两种预设算法,当某一个维度的征信统计信息被一种预设算法选中时,对应的因素层指标的积分值加1;/n将积分值排序靠前的预设数量的因素层指标作为入模因素层指标,并记录每一个准则层指标的指标分数为其包含的所有入模因素层指标的积分值之和;/n采用层次分析算法根据准则层指标计的指标分数、入模因素层指标的积分值计算每个所述准则层指标的权重及每个入模因素层指标的权重;/n获取每个入模因素层指标对应的风险评分,并计算每个入模因素层指标对应的风险评分、入模因素层指标的权重以及入模因素层指标所属的准则层指标的权重三者的乘积,作为每一个入模因素层指标对应的准则层分数;/n根据所有入模因素层指标对应的准则层分数之和,计算所述目标企业的风险评估总分。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取目标企业的准则层指标中包含的各个因素层指标对应的征信统计信息,所述目标企业包含至少两个准则层指标,每一个准则层指标至少包含一个因素层指标;
采用特征工程中的所有预设算法依次对每个维度的征信统计信息进行筛选,记录每个维度的征信统计信息对应的因素层指标的积分值,其中,所述特征工程中包含至少两种预设算法,当某一个维度的征信统计信息被一种预设算法选中时,对应的因素层指标的积分值加1;
将积分值排序靠前的预设数量的因素层指标作为入模因素层指标,并记录每一个准则层指标的指标分数为其包含的所有入模因素层指标的积分值之和;
采用层次分析算法根据准则层指标计的指标分数、入模因素层指标的积分值计算每个所述准则层指标的权重及每个入模因素层指标的权重;
获取每个入模因素层指标对应的风险评分,并计算每个入模因素层指标对应的风险评分、入模因素层指标的权重以及入模因素层指标所属的准则层指标的权重三者的乘积,作为每一个入模因素层指标对应的准则层分数;
根据所有入模因素层指标对应的准则层分数之和,计算所述目标企业的风险评估总分。


2.根据权利要求1所述的方法,其特征在于,所述根据所有入模因素层指标对应的准则层分数之和,计算所述目标企业的风险评估总分,包括:
将所有入模因素层指标对应的准则层分数之和按预设比例缩放得到所述目标企业的风险评估总分。


3.根据权利要求1所述的方法,其特征在于,所述特征工程中包含的预设算法包括:
决策树算法、方差筛选算法、皮尔逊显著性算法、递归特征消除算法、SAS决策树算法中的任意两种以上算法形成的组合。


4.根据权利要求1至3中任一项所述的方法,其特征在于,还包括:
以数值或图表形式展示所述入模因素层指标对应的准则层分数,和/或所述目标企业的风险评估总分。


5.根据权利要求1至3中任一项所述的方法,其特征在于,所述征信统计信息包括:
涉税信息、工商信息、司法信息中的一种或多种;
其中,所述涉税信息包括企业税务登记信息、股东信息、收入申报信息、税金逾期信息中的一种或多种;
所述工商信息包括企业工商登记信息、股权信息、行政...

【专利技术属性】
技术研发人员:周小玲许卫赵彦辉孙淏添
申请(专利权)人:深圳微众信用科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1