基于支持向量机的模型标签标注方法、设备及介质技术

技术编号:32019497 阅读:21 留言:0更新日期:2022-01-22 18:38
本说明书实施例公开了一种基于支持向量机的模型标签标注方法、设备及介质,方法包括:根据企业的信用数据建立信用模型的指标体系,确定出指标数据;对指标数据中的预设指标数据进行分类,并标注标签;根据标注后的预设指标数据,对预先构建的样本标签标注模型进行训练,得到符合要求的样本标签标注模型,确定预设指标数据的指标特征与标注标签的对应关系,其中,样本标签标注模型为支持向量机模型;通过符合要求的样本标签标注模型,分析指标数据中未标注指标数据的指标特征,根据预设指标数据的指标特征与标注标签的对应关系,对未标注指标数据进行分类,标注标签,以便于根据标注标签的指标数据,对信用模型进行训练,得到符合要求的信用模型。合要求的信用模型。合要求的信用模型。

【技术实现步骤摘要】
基于支持向量机的模型标签标注方法、设备及介质


[0001]本说明书计算机
,尤其涉及一种基于支持向量机的模型标签标注方法、设备及介质。

技术介绍

[0002]互联网技术的发展和应用渗透到了各个行业,尤其是金融行业。传统金融行业正接受着大数据、互联网以及用户体验不平衡不对称的严峻考验,采用大数据风控技术已经成为业内人士最关注的一个大数据应用焦点。
[0003]当前互联网金融信用体系中通常使用信用评分模型对企业进行信用评估,信用评分模型常用的方法是逻辑回归,使用逻辑回归建立信用评分模型时,在特征工程和模型训练过程中都需要用大量含有标签的数据,然而,在实际的应用环境中,很多情况下并不能获得大量有标签的数据,只能通过部分关键的指标(最近是否在失信库,纳税评级等)确定一部分样本的标签;这会使得逻辑回归建立信用评分模型的训练样本不足,无法训练出符合要求的信用评分模型。

技术实现思路

[0004]本说明书一个或多个实施例提供了一种基于支持向量机的模型标签标注方法、设备及介质,用于解决如下技术问题:在实际的应用环境中,无法获取大部本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于支持向量机的模型标签标注方法,其特征在于,所述方法包括:根据企业的信用数据建立信用模型的指标体系,确定出指标数据,其中,所述指标体系用于表示所述企业的信用情况;对所述指标数据中的预设指标数据进行分类,并标注标签;根据标注后的预设指标数据,对预先构建的样本标签标注模型进行训练,得到符合要求的样本标签标注模型,确定所述预设指标数据的指标特征与标注标签的对应关系,其中,所述样本标签标注模型为支持向量机模型;通过所述符合要求的样本标签标注模型,分析所述指标数据中未标注指标数据的指标特征,并根据所述预设指标数据的指标特征与标注标签的对应关系,对所述未标注指标数据进行分类,并标注标签,以便于根据标注标签的指标数据,对所述信用模型进行训练,得到符合要求的信用模型。2.根据权利要求1所述的一种基于支持向量机的模型标签标注方法,其特征在于,所述根据企业的信用数据建立所述信用模型的指标体系之前,所述方法包括:通过多方渠道采集企业的信用数据;对所述信用数据进行分析融合处理,形成数据集,并存储至数据库中;其中,所述信用数据的结构类型包括半结构化数据和结构化数据。3.根据权利要求2所述的一种基于支持向量机的模型标签标注方法,其特征在于,所述对所述信用数据进行分析融合处理,具体包括:将结构类型为半结构化数据的信用数据转换为结构化数据,以便将所述信用数据中的具有互补关系的数据进行数据融合,将所述信用数据中的具有冗余关系的数据进行去重处理。4.根据权利要求1所述的一种基于支持向量机的模型标签标注方法,其特征在于,所述确定出指标数据之后,所述方法包括:确定出所述指标数据中的无效数据,以便在所述指标数据中去除所述无效数据,其中,所述无效数据是指与所述企业信用情况不相关的数据;对所述指标数据进行同值统计和缺失值统计,以便去除同值率超过预设范围的字段以及包含相同数值的字段,去除字段缺失率超过预设范围的字段。5.根据权利要求1所述的一种基于支持向量机的模型标签标注方法,其特征在于,所述确定所述预设指标数据的指标特征与标注标签的对应关系,具体包括:确定所述预设指标数据对应的至少一个指标特征;根据标注标签对应的分类信息,确定所述至少一个指标特征的权重;根据所述至少一个指标特征的权重,确定所述至少一个指标特征与所述标注标签的对应关系。6.根据权利要求1所述的一种基于支持向量机的模型标签标注方法,其特征在于,所述得到符合要求的样本标签标注模型之前,所述方法还包括:将所述预设指标数据分为训练集和测试集;将所述训练集中的预设指标数据输入至预先构建...

【专利技术属性】
技术研发人员:郭长营崔乐乐
申请(专利权)人:天元大数据信用管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1