一种基于联邦学习的企业风险预测方法和系统技术方案

技术编号:32296420 阅读:18 留言:0更新日期:2022-02-12 20:06
公开了一种基于联邦学习的企业风险预测方法和系统,包括将企业经营数据与第三方数据提交到联邦存储库中,其中,第三方数据包括咨询和审计数据;基于预设数据规范在联邦存储库中对企业经营数据和第三方数据进行自由样本的加工处理,加工处理包括同态加密和业务数据对齐;利用机器学习和深度学习模型训练分别构建企业和第三方算法模型,从各自模型中抽样获得样本数据,并将样本数据输入联邦学习技术平台进行联合建模,生成联合模型;利用联合模型进行联合预测,并将预测结果反馈至企业和第三方算法模型。本申请可用于明确当前企业的业务漏洞,预测未来企业中存在风险。预测未来企业中存在风险。预测未来企业中存在风险。

【技术实现步骤摘要】
一种基于联邦学习的企业风险预测方法和系统


[0001]本专利技术涉及企业风险预测的应用领域,尤其是一种基于联邦学习的企业风险预测方法和系统。

技术介绍

[0002]目前,企业运营过程中的风险预测主要依据专家的经验或企业管理层依据以往工作经验以及市场环境等因素进行主观判断。分析的准确性主要依赖于分析人员的个人经验和能力,主观因素较大、标准不统一,需要人工筛查任务繁重,因此对市场洞察力和企业风险预测能力不足。
[0003]而且,涉及第三方(如审计等)的数据由于标准不统一,因此,现有的风险预测由于数据量巨大,人工整合数据、分析总结、得出结等工作量大,人工筛查任务繁重,效率低,无法对信息全面筛查,使得预测结果的准确性大打折扣,很难对企业起到帮助的作用。

技术实现思路

[0004]为了解决现有技术中企业风险预测中存在的种种技术问题,本专利技术提出了一种基于联邦学习的企业风险预测方法和系统,用以解决上述技术问题,
[0005]根据本专利技术的一个方面,提出了一种基于联邦学习的企业风险预测方法,包括:
[0006]S1:将企业经营数据与第三方数据提交到联邦存储库中,其中,第三方数据包括咨询和审计数据;
[0007]S2:基于预设数据规范在联邦存储库中对企业经营数据和第三方数据进行自由样本的加工处理,加工处理包括同态加密和业务数据对齐;
[0008]S3:利用机器学习和深度学习模型训练分别构建企业和第三方算法模型,从各自模型中抽样获得样本数据,并将样本数据输入联邦学习技术平台进行联合建模,生成联合模型;以及
[0009]S4:利用联合模型进行联合预测,并将预测结果反馈至企业和第三方算法模型。
[0010]在一些具体的实施例中,步骤S2中对企业经营数据和第三方数据进行同态加密后保存至联邦存储库中,且在整个风险预测过程中的所有数据均为同态加密后的密文。
[0011]在一些具体的实施例中,步骤S2中的业务数据对齐包括将企业和第三方的数据进行量化切分。
[0012]在一些具体的实施例中,企业和第三方算法模型获取对应的分类数据、特征数据和核心业务数据,核心业务数据包括样本ID、业务特征变量和表现数据。
[0013]在一些具体的实施例中,样本数据包括企业和第三方算法模型的训练参数和梯度。
[0014]在一些具体的实施例中,步骤S3中的联合建模具体包括:对输入的企业和第三方的数据样本进行样本ID匹配,输出样本ID交集后进行模型的训练,生成联合模型。
[0015]在一些具体的实施例中,步骤S4之后还包括:企业和第三方算法模型根据联合模
型反馈的参数进行更新训练。
[0016]在一些具体的实施例中,联合模型中的风险模型公式为Ris=min(150,F1)+min(150,F2)+min(150,F3)+min(150,F4)+min(150,F5),其中,Ris为风险分数,F1表示法人股东情况,F2表示经营情况,F3表示信用情况,F4表示竞争能力,F5表示行业趋势。
[0017]根据本专利技术的第二方面,一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述方法。
[0018]根据本专利技术的第二方面,提出了一种基于联邦学习的企业风险预测系统,该系统包括:
[0019]数据存储单元:配置用于将企业经营数据与第三方数据提交到联邦存储库中,其中,第三方数据包括咨询和审计数据;
[0020]数据加工单元:配置用于基于预设数据规范在联邦存储库中对企业经营数据和第三方数据进行自由样本的加工处理,加工处理包括同态加密和业务数据对齐;
[0021]联合模型构建单元:配置用于利用机器学习和深度学习模型训练分别构建企业和第三方算法模型,从各自模型中抽样获得样本数据,并将样本数据输入联邦学习技术平台进行联合建模,生成联合模型;
[0022]预测单元:配置用于利用联合模型进行联合预测,并将预测结果反馈至企业和第三方算法模型。
[0023]本专利技术的一种基于联邦学习的企业风险预测方法和系统,采用了符合应用需求的、平衡的“数据安全

计算效率

交互效率”技术框架。在保障企业数据隐私和企业数据安全的前提下,提高计算和交互效率,并保证联邦学习训练的模型的性能与集中训练获得的模型的性能一样。通过对联邦学习模型结构进行调整,对企业经营数和第三方数据分开抽样、训练等作业,周期性对两方训练模型进行匹配并生成联合模型,将训练后的联合模型输入到联合风险预测模型中。利用企业当前经营活动数据,结合第三方(如审计)数据进行深度的学习预判,明确当前企业的业务漏洞,预测未来企业中存在风险。
附图说明
[0024]包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本专利技术的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。附图的元件不一定是相互按照比例的。同样的附图标记指代对应的类似部件。
[0025]图1是本申请的一个实施例的基于联邦学习的企业风险预测方法的流程图;
[0026]图2是本申请的一个具体的实施例的基于联邦学习的企业风险预测方法的流程示意图;
[0027]图3是本申请的一个实施例的基于联邦学习的企业风险预测系统的框架图;
[0028]图4是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0029]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了
便于描述,附图中仅示出了与有关专利技术相关的部分。
[0030]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0031]图1出了根据本申请的一个实施例的基于联邦学习的企业风险预测方法的流程图,如图1所示,该方法包括以下步骤:
[0032]S101:将企业经营数据与第三方数据提交到联邦存储库中,其中,第三方数据包括咨询和审计数据。
[0033]S102:基于预设数据规范在联邦存储库中对企业经营数据和第三方数据进行自由样本的加工处理,加工处理包括同态加密和业务数据对齐。企业与第三方数据提供方根据规定好的数据规范在联邦存储库中进行自由样本的加工工作,每个样本对应一个唯一sample id,包含联邦学习中的同态加密和相应业务数据的对齐工作。
[0034]在具体的实施例中,同态加密实现基本的加密操作之外,还能实现密文间的多种计算功能,即先计算后解密可等价于先解密后计算。为保障企业及第三方数据的数据安全,企业经营数据和第三方数据都进行同态加密,加密后保存到联邦存储库中。在整个联合风险预测过程中,所有数据都是加密的密文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的企业风险预测方法,其特征在于,包括:S1:将企业经营数据与第三方数据提交到联邦存储库中,其中,所述第三方数据包括咨询和审计数据;S2:基于预设数据规范在所述联邦存储库中对所述企业经营数据和所述第三方数据进行自由样本的加工处理,所述加工处理包括同态加密和业务数据对齐;S3:利用机器学习和深度学习模型训练分别构建企业和第三方算法模型,从各自模型中抽样获得样本数据,并将所述样本数据输入联邦学习技术平台进行联合建模,生成联合模型;以及S4:利用所述联合模型进行联合预测,并将预测结果反馈至所述企业和第三方算法模型。2.根据权利要求1所述的基于联邦学习的企业风险预测方法,其特征在于,所述步骤S2中对所述企业经营数据和所述第三方数据进行同态加密后保存至所述联邦存储库中,且在整个风险预测过程中的所有数据均为同态加密后的密文。3.根据权利要求1所述的基于联邦学习的企业风险预测方法,其特征在于,所述步骤S2中的业务数据对齐包括将所述企业和第三方的数据进行量化切分。4.根据权利要求1所述的基于联邦学习的企业风险预测方法,其特征在于,所述企业和第三方算法模型获取对应的分类数据、特征数据和核心业务数据,所述核心业务数据包括样本ID、业务特征变量和表现数据。5.根据权利要求1所述的基于联邦学习的企业风险预测方法,其特征在于,所述样本数据包括所述企业和第三方算法模型的训练参数和梯度。6.根据权利要求4所述的基于联邦学习的企业风险预测方法,其特征在于,所述步骤S3中的联合建模具体包括:对输入的所述企业和第三方的数据样本进行样本...

【专利技术属性】
技术研发人员:庄晓明吴少华吴江煌许佳裕林晓东孙健都
申请(专利权)人:厦门美亚亿安信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1