面向多方企业联合信用评级的特征组合筛选方法及应用技术

技术编号：35359681 阅读：20 留言：0更新日期：2022-10-26 12:43

本方案提供一种面向多方企业联合信用评级的特征组合筛选方法及应用，构建由至少两参与方以纵向联邦学习参与建模的企业信用评级模型，并获取每一参与方的特征数据对训练得到的企业信用评级模型的沙普利值的边际贡献量；选取边际贡献量最大的特征数据作为起始特征数据，基于起始特征数据采用贪心算法迭代筛选有效特征数据，整合所述起始特征数据和所述有效特征数据作为特征组合，在保证多方企业信用数据的隐私性的前提下，降低模型的过拟合性的同时有效地控制了数据成本，且可保证企业信用评级模型的预测性能不受影响。评级模型的预测性能不受影响。评级模型的预测性能不受影响。

全部详细技术资料下载

【技术实现步骤摘要】
面向多方企业联合信用评级的特征组合筛选方法及应用

[0001]本申请涉及企业评级领域，特别涉及一种面向多方企业联合信用评级的特征组合筛选方法及应用。

技术介绍

[0002]企业信用评级，指的是信用评估机构对征集到的企业信用信息，依据一定指标进行信用等级评定的活动。企业主体信用分析的主要内容包括：产业、企业素质、经营管理、财务状况和偿债能力等方面。由于企业各项财务指标与信用风险之间往往存在着非线性关系，因此人工神经网络比较适用于企业的信用评价。现阶段，各机构都在着手建立或优化企业信用评级模型，但大多基于机构自身拥有的企业数据，而因为大多数机构内部的企业数据有限，导致各个机构的信用评级模型往往达不到预期的实用效果。
[0003]若需要得到更好的企业评级结果，需要结合多方的企业信用数据，然而不同机构之间的数据又存在数据壁垒以及数据隐私保护的监管要求，导致不同机构通常不能进行数据传输或交换，导致“数据孤岛”问题，限制了企业信用评级模型的推广和发展。联邦学习技术则是该场景下的一个解决方案，能够在保证模型性能的同时保护数据隐私。联邦学习范式的主要思想是建立基于跨多个数据源存在的训练数据集的机器学习模型，而不需要在各个数据拥有者之间直接交换数据。这种模式允许多个参与者协同训练一个联合模型，并将其数据保存在本地，在一定程度上解决数据隐私安全问题，实现联合建模。
[0004]然而在利用联邦学习构建联合多方企业信用数据的企业信用评级模型的方案中，通过采用纵向联邦学习的方式，此时各参与方的特特征存在重复或者高度相关的特征，...

【技术保护点】

【技术特征摘要】
1.一种面向多方企业联合信用评级的特征组合筛选方法，其特征在于，包括：构建由至少两参与方以纵向联邦学习参与建模的企业信用评级模型，并获取每一参与方的特征数据对训练得到的企业信用评级模型的沙普利值的边际贡献量；选取边际贡献量最大的特征数据作为起始特征数据，基于所述起始特征数据采用贪心算法迭代筛选有效特征数据，整合所述起始特征数据和所述有效特征数据作为特征组合。2.根据权利要求1所述的面向多方企业联合信用评级的特征组合筛选方法，其特征在于，“构建由至少两参与方以纵向联邦学习参与建模的企业信用评级模型”包括以下步骤：获取各个参与方的特征数据，其中所述特征数据标记有企业信用评级结果，且特征数据具有相同或重叠的样本空间但不同的特征空间；对各个参与方的特征数据进行样本对齐，并对对齐后的特征数据进行计算和加密后输入到企业信用评级模型中进行学习；对各参与方上传的特征数据进行全局聚合后更新所述企业信用评级模型。3.根据权利要求2所述的面向多方企业联合信用评级的特征组合筛选方法，其特征在于，可信第三方服务端将企业信用评级模型下发给各个参与方，各个参与方利用本地的特征数据进行计算得到本次计算结果结果，采用同态加密的方式进行加密后再上传给可信第三方服务端，第三方服务端根据各参与方上传的本地计算结果，对企业信用评级模型进行聚合更新，并将结果再次下发到各参与方。4.根据权利要求1所述的面向多方企业联合信用评级的特征组合筛选方法，其特征在于，在“获取每一参与方的特征数据对训练得到的企业信用评级模型的沙普利值的边际贡献量”步骤中，将每个参与方的特征数据分别输入到企业信用评级模型得到优化指标，基于优化指标计算每个特征数据的沙普利值的边际贡献量。5.根据权利要求1所述的面向多方企业联合信用评级的特征组合筛选方法，其特征在于，“基于所述起始特征数据采用贪心算法迭代筛选有效特征数据”包括以下步骤：S1:整合所有参与方的所有特征数据为全局特征集，选择起始特征数据作为入模的第一个特征P1=p1；S2:固定第一个选定的初始特征组合P
k
，依次将全局特征集合S中的其余特征与初...

【专利技术属性】
技术研发人员：陈定，徐行，吴俊杰，刘冠男，陈宏，张丽君，
申请(专利权)人：杭州衡泰技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人