基于半监督回归算法的企业评估方法、介质、设备及应用技术

技术编号:34726882 阅读:21 留言:0更新日期:2022-08-31 18:14
本发明专利技术涉及一种基于半监督回归算法的企业评估方法、介质、设备及应用,对应每个类别的企业收集数据,构建数据集;清理、标注,构建训练样本,对应每个类别的企业构建半监督回归模型,训练模型至稳定;对新的待评估企业,确定企业类别,获取企业的数据、处理后以半监督回归模型获得评估分数;基于此方法介质、设备等可以落实于多个应用场景中。本发明专利技术根据不同类型的企业,采用多个特征维度,构建不同评估模型,综合多个模型的计算结果作为企业的最终评估结果,比单一财务指标、单一模型的评估结果更精确,并且只要存在新的企业数据,就可以主动获取该企业的相关特征数据,并及时对其做出运算和评估,更具实时性,评估结果更为可靠,效率大幅提升。大幅提升。大幅提升。

【技术实现步骤摘要】
基于半监督回归算法的企业评估方法、介质、设备及应用


[0001]本专利技术涉及计算;推算或计数的
,特别涉及一种基于半监督回归算法的企业评估方法、介质、设备及应用。

技术介绍

[0002]近年来,不管是政府还是社会各界,对于企业的综合评价越来越重视,这个过程当中自然与实际的效益转化率相关,也有利于将资源倾向至对应的、对口的企业。有效识别成长迅速的企业可以使得管理人员给出更精准的扶持和效果评价。
[0003]现有技术中,目前企业的评估基本还是由专家根据企业的一些财务指标(如企业历史销售、利润等增长情况)来进行分析和评价,但企业的成长是个复杂的过程,从财务这一单一角度对其进行评价有失偏颇,另外,这种企业评估方法需要耗费大量的人力、物力,不能在短时间内对大量的企业给出评估结果,也不能及时的关注到企业的变化情况,缺乏实时性。
[0004]如中国专利“一种企业评估方法、装置、设备及计算机存储介质”(CN113627730A)公开了,获取目标企业的多个一级指标、二级指标和三级指标,将多个一级指标、二级指标和三级指标进行筛选,得到筛选后的目标一级指标、目标二级指标和目标三级指标,获取目标企业的评估数据,根据获取的评估数据和目标一级指标、目标二级指标和目标三级指标建立企业评估模型,根据企业评估模型对企业进行评估;这里就是通过多级指标对企业进行评估,缺乏实时性,评价的结果也不见得准确。

技术实现思路

[0005]本专利技术解决了现有技术中存在的问题,提供了一种优化的基于半监督回归算法的企业评估方法、介质、设备及应用。
[0006]本专利技术所采用的技术方案是,一种基于半监督回归算法的企业评估方法,所述方法包括以下步骤:步骤1:将企业分类,对应每个类别的企业收集数据,构建数据集;步骤2:清理数据集,标注,构建训练样本;步骤3:对应每个类别的企业构建半监督回归模型,以训练样本训练模型至稳定;步骤4:若存在新的待评估企业,则确定企业类别,获取企业的数据、处理后输入对应企业类别的半监督回归模型,获得评估分数。
[0007]优选地,所述企业分类包括至少三类。
[0008]优选地,对应不同类别的企业,收集的数据包括知识产权数量、科技研发成果及企业资质、投融资数据、招投标数量、供应商数量、客户数量、交易量。
[0009]优选地,所述步骤2中,对应每个分类的数据,取其中的20%标注输出结果,作为训练样本池。
[0010]优选地,所述步骤3包括以下步骤:
步骤3.1:对应每个类别的企业构建2个KNN模型,所述2个KNN模型的参数不同;步骤3.2:将所述训练样本池按照预设比例p1分为2份,得到L1、L2,分别训练2个KNN模型;步骤3.3:将未标注的样本数据按照预设比例p2分为2份,得到U1、U2;步骤3.4:分别取U1、U2中的部分样本数据S1、S2,分别输入步骤3.2训练后的2个KNN模型,以输出的结果分别与对应的S1、S2作为新的训练样本加入对应的训练样本池L1、L2,重新训练对应的KNN模型;步骤3.5:若重新训练后的任一KNN模型的正确率提高,则将S1和/或S2加入不对应的训练样本池中,并自U1和/或U2中删除,返回步骤3.4,否则进行下一步;步骤3.6:训练结束,输出2个KNN模型。
[0011]优选地,p1≠p2。
[0012]优选地,所述步骤4中,将处理后的数据输入企业类别的半监督回归模型,获得2个针对当前企业的分数Score1和Score2;基于Score1和Score2、比例p1和/或p2获得企业的评估分数S。
[0013]一种计算机可读存储介质,其上存储有基于半监督回归算法的企业评估程序,该程序被处理器执行时实现上述基于半监督回归算法的企业评估方法。
[0014]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述基于半监督回归算法的企业评估方法。
[0015]一种所述的基于半监督回归算法的企业评估方法的应用,应用于园区内新企业的引入评估,或地块划分的评估。
[0016]本专利技术涉及一种优化的基于半监督回归算法的企业评估方法、介质、设备及应用,将企业分类,对应每个类别的企业收集数据,构建数据集;清理数据集,标注,构建训练样本后,对应每个类别的企业构建半监督回归模型,以训练样本训练模型至稳定;对新的待评估企业,确定企业类别,获取企业的数据、处理后输入对应企业类别的半监督回归模型,获得评估分数;基于此方法介质、设备等可以落实于多个应用场景中。
[0017]本专利技术根据不同类型的企业,采用多个特征维度,构建不同评估模型,并综合多个模型的计算结果作为企业的最终评估结果,比单一财务指标、单一模型的评估结果更精确,并且只要存在新的企业数据,就可以主动获取该企业的相关特征数据,并及时对其做出运算和评估,更具实时性,评估结果更为可靠,效率大幅提升。
附图说明
[0018]图1为本专利技术的方法流程图;图2为本专利技术的模型训练流程图;图3为本专利技术的评估分数的计算流程图。
具体实施方式
[0019]下面结合实施例对本专利技术做进一步的详细描述,但本专利技术的保护范围并不限于此。
[0020]本专利技术涉及一种基于半监督回归算法的企业评估方法,主要包括三部分内容:
(1)企业特征数据采集、清洗、转换;(2)针对三大类企业训练不同半监督回归模型;(3)计算评估三大类企业的得分。
[0021]本专利技术中,需要收集整理各行业企业的相关数据,包括但不限于专利数量、软著数量、商标数量、是否为高新技术企业、是否为省级科技型中小企业、是否为雏鹰企业、是否为独角兽企业、是否为准独角兽企业、是否为鲲鹏企业、最近一轮融资时间、最近一轮融资金额、最近一轮融资的投资机构情况、企业的招投标数量、企业的供应商数量、企业的客户数量、企业的地块公示数量、购地交易金额等,作为训练样本数据,进而提高模型的计算准确度。
[0022]本专利技术中,对于不同类型的企业,其评价标准显然是不一样的,一般来说,可以将企业按行业类别分为三类,为了确保准确度,可以将企业进一步细分,提高评估分数的有效性。
[0023]本实施例中,三类企业包括:Ⅰ类企业:信息传输、软件和信息技术服务业,科学研究和技术服务业,制造业;Ⅱ类企业:建筑业,房地产业,水利、环境和公共设施管理业,采矿业,电力、热力、燃气及水生产和供应业,交通运输、仓储和邮政业,农、林、牧、渔业;Ⅲ类企业:金融业,批发和零售业,住宿和餐饮业,租赁和商务服务业,居民服务、修理和其他服务业,教育,卫生和社会工作,文化、体育和娱乐业。
[0024]本专利技术中,针对不同类型的企业,选择不同的特征维度,训练不同的回归模型,再用该模型去计算评估同类型的企业。
[0025]所述方法包括以下步骤:步骤1:将企业分类,对应每个类别的企业收集数据,构建数据集;所述企业分类包括至少三类。
[0026]对应不同类别的企业,收集的数据包括知识产权数量、科本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于半监督回归算法的企业评估方法,其特征在于:所述方法包括以下步骤:步骤1:将企业分类,对应每个类别的企业收集数据,构建数据集;步骤2:清理数据集,标注,构建训练样本;步骤3:对应每个类别的企业构建半监督回归模型,以训练样本训练模型至稳定;步骤4:若存在新的待评估企业,则确定企业类别,获取企业的数据、处理后输入对应企业类别的半监督回归模型,获得评估分数。2.根据权利要求1所述的一种基于半监督回归算法的企业评估方法,其特征在于:所述企业分类包括至少三类。3.根据权利要求2所述的一种基于半监督回归算法的企业评估方法,其特征在于:对应不同类别的企业,收集的数据包括知识产权数量、科技研发成果及企业资质、投融资数据、招投标数量、供应商数量、客户数量、交易量。4.根据权利要求1所述的一种基于半监督回归算法的企业评估方法,其特征在于:所述步骤2中,对应每个分类的数据,取其中的20%标注输出结果,作为训练样本池。5.根据权利要求2所述的一种基于半监督回归算法的企业评估方法,其特征在于:所述步骤3包括以下步骤:步骤3.1:对应每个类别的企业构建2个KNN模型,所述2个KNN模型的参数不同;步骤3.2:将所述训练样本池按照预设比例p1分为2份,得到L1、L2,分别训练2个KNN模型;步骤3.3:将未标注的样本数据按照预设比例p2分为2份,得到U1、U2;步骤3.4:分别取U1、...

【专利技术属性】
技术研发人员:张福军袁玲李祥兵
申请(专利权)人:绿城科技产业服务集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1