当前位置: 首页 > 专利查询>孙明俊专利>正文

一种科技企业评级模型评价特征分类方法技术

技术编号:37672948 阅读:12 留言:0更新日期:2023-05-26 04:35
本发明专利技术涉及大数据分析处理技术领域,尤其涉及一种科技企业评级模型评价特征分类方法,本发明专利技术通过数据库中信用数据的数据量判定数据库的复杂度等级,根据预存储于特征数据库的特征关键词对第一复杂度等级的数据库的信用数据进行分类,并将信用数据存储至所属的子数据库,根据各子数据库中存储的信用数据的数据量确定出可用于训练分类模型的子数据库,将可用于训练分类模型的子数据库中的信用数据输入分类模型,根据分类结果获取评价结果,根据评价结果的合格率判定分类模型是否合格,并在分类模型被判定不合格时对分类模型中预设的影响因子对比阈值进行调整得到合格的分类模型以对信用数据分类,提高科技企业信用数据分类的准确性以及科学性。类的准确性以及科学性。类的准确性以及科学性。

【技术实现步骤摘要】
一种科技企业评级模型评价特征分类方法


[0001]本专利技术涉及大数据分析处理
,尤其涉及一种科技企业评级模型评价特征分类方法。

技术介绍

[0002]通过分类模型对科技企业的信用进行评级是对科技企业履行相应经济契约的能力以及科技企业整体的可信程度所作的综合分析,能够有效帮助科技企业预测风险、防范风险,促进行业良好发展,其中,对科技企业的信用数据进行科学合理的分类是决定分类模型对企业作出准确的评价结果的重要环节。
[0003]中国专利公开号:CN112819341A,公开了如下内容,该专利技术公开了一种科技型小微企业信用风险评估方法,属于大数据分析处理
该方法包括(1)面向科技型小微企业,构建“人+事+科技属性”的信用风险评价体系;并基于最新网络公开数据,构建可以“实时获得”的指标

数据映射方案;(2)通过最新公开数据源获取数据后,采用监督型合并C4.5模型,利用所述数据进行阈值训练,对超过阈值的高熵分枝进行合并;(3)基于SM

C4.5算法训练得到针对23项二级维度指标的小微企业风险评级模型。通过实验测得企业风险查准率和查全率分别是81.47%和82.4%,较之以往方法,具有更好的效果。
[0004]但是,现有技术中,还存在以下问题:
[0005]在现有技术中,未考虑对于样本数据进行分类以及区分,并通过样本数据对分类模型进行训练后的评价结果,对分类模型中预设的对比阈值进行调整,使以样本数据对分类模型进行训练时,重新对样本数据进行分类,提高样本数据分类的准确性以及科学性。

技术实现思路

[0006]为解决上述问题,本专利技术提供一种科技企业评级模型评价特征分类方法,其包括:
[0007]步骤S1,建立若干数据库用以存储各科技企业的信用数据,并基于各所述数据库中所存储的信用数据的数据量判定各所述数据库的复杂度等级;
[0008]步骤S2,获取属于第一复杂度等级的数据库的信用数据,将所述信用数据存储至不同的子数据库中,以将所述信用数据分类,存储过程包括,基于信用数据与预存储于特征数据库中的特征关键词的匹配结果确定信用数据需存储的子数据库;
[0009]步骤S3,根据各所述子数据库中存储的信用数据的数据量判定各所述子数据库是否可用于训练分类模型;
[0010]步骤S4,逐个调用可用于训练分类模型的子数据库,将已调用子数据库中的信用数据输入所述分类模型,以对信用数据进行分类,基于分类结果输出若干评价参量,基于评价参量获取所述已调用子数据库的评价结果,并基于所述评价结果的离散参量解析判定所述已调用子数据库的评价结果是否合格,并基于可用于训练分类模型的所有子数据库的评价结果判定数据库的评价结果是否合格,各所述评价参量以及评价结果为所述分类模型内预设的算法计算所得;
[0011]步骤S5,根据评价结果的合格率判定所述分类模型是否合格,并在所述分类模型被判定不合格时对分类模型中预设的影响因子对比阈值进行调整后返回所述步骤S4,直至所述分类模型合格;
[0012]步骤S6,得到合格的分类模型,以对信用数据进行分类。
[0013]进一步地,在所述步骤S1中,获取各所述数据库中所存储的信用数据的数据量Nc,将所述数据量Nc与预设的数据库数据量对比阈值Nc0进行对比,并根据对比结果判定所述数据库的复杂度等级,其中,
[0014]若对比结果满足第一数据量对比结果,则判定所述数据库的复杂度等级为第一复杂度等级;
[0015]若对比结果满足第二数据量对比结果,则判定所述数据库的复杂度等级为第二复杂度等级;
[0016]所述第一数据量对比结果为Nc≥Nc0,所述第二数据量对比结果为Nc<Nc0。
[0017]进一步地,在所述步骤S2中,预建立各所述特征数据库与子数据库的关联关系,将所述信用数据与各所述特征数据库中的特征关键词进行对比,并根据对比结果判定信用数据需存储的子数据库,其中,
[0018]若对比结果满足预设存储条件,则判定需将所述信用数据存储至所述特征数据库关联的子数据库中;
[0019]所述预设存储条件为所述信用数据与特征数据库中的特征关键词相同。
[0020]进一步地,在所述步骤S3中,获取所述子数据库中存储的信用数据的数据量Ne,将所述数据量Ne与预设的集合数据量对比阈值Ne0进行对比,并根据对比结果判定所述子数据库是否可用于训练分类模型,其中,
[0021]若对比结果满足第三数据量对比结果,则判定所述子数据库可用于训练分类模型;
[0022]若对比结果满足第四数据量对比结果,则判定所述子数据库不可用于训练分类模型;
[0023]所述第三数据量对比结果为Ne≥Ne0,所述第四数据量对比结果为Ne<Ne0。
[0024]进一步地,在所述步骤S4中,将可用于训练分类模型的子数据库中的信用数据输入所述分类模型进行运算,其中,
[0025]按照公式(1)计算所述信用数据的影响因子特征参量F,
[0026][0027]公式(1)中,S0表示全部特征数据库中特征关键词的数据量和;
[0028]将所述影响因子特征参量F与所述分类模型中预设的第一影响因子对比阈值F1以及第二影响因子对比阈值F2进行对比,并根据对比结果对所述信用数据进行分类,其中,
[0029]若对比结果满足第一影响因子对比结果,判定所述信用数据为第一类别,并将所述信用数据存储至第一影响数据集合;
[0030]若对比结果满足第二影响因子对比结果,判定所述信用数据为第二类别,并将所述信用数据存储至第二影响数据集合;
[0031]若对比结果满足第三影响因子对比结果,判定所述信用数据为第三类别,并将所
述信用数据存储至第三影响数据集合;
[0032]所述第一影响因子对比结果为F≥F2,所述第二影响因子对比结果为F1≤F<F2,所述第三影响因子对比结果为F<F1。
[0033]进一步地,所述步骤S4中,对所述信用数据分类完成时,获取各影响数据集合中的信用数据的数据量,按照公式(2)计算子数据库的评价参量Re,
[0034]Re=n1*A%+n2*B%+n3*C%(2)
[0035]公式(2)中,n1表示属于所述第一影响数据集合中信用数据的数据量,n2表示属于所述第二影响数据集合中信用数据的数据量,n3表示属于所述第三影响数据集合中信用数据的数据量,A%表示预设的第一比例参量,B%表示预设的第二比例参量,C%表示预设的第三比例参量;
[0036]获取所述分类模型输出的若干评价参量Re,按照公式(3)计算子数据库的评价结果Re


[0037][0038]公式(3)中,Re
i
表示所述子数据库的第i个评价参量,a表示所述分类模型输出的评价参量Re的数据量。
[0039]进一步地,在所述步骤S4中,按照公式(4)计算所述子数据库的评价结果的离散参量E,
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种科技企业评级模型评价特征分类方法,其特征在于,包括:步骤S1,建立若干数据库用以存储各科技企业的信用数据,并基于各所述数据库中所存储的信用数据的数据量判定各所述数据库的复杂度等级;步骤S2,获取属于第一复杂度等级的数据库的信用数据,将所述信用数据存储至不同的子数据库中,以将所述信用数据分类,存储过程包括,基于信用数据与预存储于特征数据库中的特征关键词的匹配结果确定信用数据需存储的子数据库;步骤S3,根据各所述子数据库中存储的信用数据的数据量判定各所述子数据库是否可用于训练分类模型;步骤S4,逐个调用可用于训练分类模型的子数据库,将已调用子数据库中的信用数据输入所述分类模型,以对信用数据进行分类,基于分类结果输出若干评价参量,基于评价参量获取所述已调用子数据库的评价结果,并基于所述评价结果的离散参量解析判定所述已调用子数据库的评价结果是否合格,并基于可用于训练分类模型的所有子数据库的评价结果判定数据库的评价结果是否合格,各所述评价参量以及评价结果为所述分类模型内预设的算法计算所得;步骤S5,根据评价结果的合格率判定所述分类模型是否合格,并在所述分类模型被判定不合格时对分类模型中预设的影响因子对比阈值进行调整后返回所述步骤S4,直至所述分类模型合格;步骤S6,得到合格的分类模型,以对信用数据进行分类。2.根据权利要求1所述的科技企业评级模型评价特征分类方法,其特征在于,在所述步骤S1中,获取各所述数据库中所存储的信用数据的数据量Nc,将所述数据量Nc与预设的数据库数据量对比阈值Nc0进行对比,并根据对比结果判定所述数据库的复杂度等级,其中,若对比结果满足第一数据量对比结果,则判定所述数据库的复杂度等级为第一复杂度等级;若对比结果满足第二数据量对比结果,则判定所述数据库的复杂度等级为第二复杂度等级;所述第一数据量对比结果为Nc≥Nc0,所述第二数据量对比结果为Nc<Nc0。3.根据权利要求2所述的科技企业评级模型评价特征分类方法,其特征在于,在所述步骤S2中,预建立各所述特征数据库与子数据库的关联关系,将所述信用数据与各所述特征数据库中的特征关键词进行对比,并根据对比结果判定信用数据需存储的子数据库,其中,若对比结果满足预设存储条件,则判定需将所述信用数据存储至所述特征数据库关联的子数据库中;所述预设存储条件为所述信用数据与特征数据库中的特征关键词相同。4.根据权利要求3所述的科技企业评级模型评价特征分类方法,其特征在于,在所述步骤S3中,获取所述子数据库中存储的信用数据的数据量Ne,将所述数据量Ne与预设的集合数据量对比阈值Ne0进行对比,并根据对比结果判定所述子数据库是否可用于训练分类模型,其中,若对比结果满足第三数据量对比结果,则判定所述子数据库可用于训练分类模型;若对比结果满足第四数据量对比结果,则判定所述子数据库不可用于训练分类模型;所述第三数据量对比结果为Ne≥Ne0,所述第四数据量对比结果为Ne<Ne0。
5.根据权利要求4所述的科技企业评级模型评价特征分类方法,其特征在于,在所述步骤S4中,将可用于训练分类模型的子数据库中的信用数据输入所述分类模型进行运算,其中,按照公式(1)计算所述信用数据的影响因子特征参量F,公式(1)中,S0表示全部特征数据库中特征关键词的数据量和;将所述影响因子特征参量F与所述分类模型中预设的第一影响因子对比阈值F1以及第二影响因子对比阈值F2进行对比,并根据对比结果对所述信用数据进行分类,其中,若对比结果满足第一影响因子对比结果,判定所述信用数据为第一类别,并将所述信用数据存储至第一影响数据集合;若对比结果满足第二影响因子对比结果,判定所述信用数据为第二类别,并将所述信用数据存储至第...

【专利技术属性】
技术研发人员:孙明俊
申请(专利权)人:孙明俊
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1