【技术实现步骤摘要】
一种企业风险识别模型的构建方法及系统
本专利技术涉及风险识别
,特别涉及一种企业风险识别模型的构建方法及系统。
技术介绍
企业在经营活动中的各种行为,原则上都会受到各种部门的监管,以维护市场的良性发展。例如,通过识别企业是否为空壳公司,可以防止空壳公司参与各种买空卖空事件,进行经济犯罪,且通常资金规模庞大,降低或避免空壳公司威胁金融秩序和经济发展。当前识别空壳公司工作主要依赖于传统的规则模型,主要利用企业账户的基本信息和交易特征对空壳公司进行排查,比如不同公司的注册地址高度重合、公司账户短期内交易频繁且金额巨大,且与注册资本规模明显不符等特征。并且现阶段识别空壳公司模型的特征,主要提取与目标企业相关的工商信息,例如公司注册资本、公司员工数量、公司商标数量、同一注册地址注册的多家企业等工商信息指标以及资金端交易数据作为空壳公司的特征指标,但是这种方法会造成图结构信息在指标构建过程中被大量丢失,关联方的风险点也没有被很好地捕捉,基于这类指标很难精确地识别空壳公司风险。
技术实现思路
本专利技术的 ...
【技术保护点】
1.一种企业风险识别模型的构建方法,其特征在于,包括以下步骤:/n获取样本公司的关联方网络图谱结构,所述样本公司包括黑样本和白样本;/n基于图挖掘算法Structure to Vector对样本公司的网络结构进行编码,获得样本公司网络结构的风险特征;/n学习获得的风险特征,构建所述企业风险识别模型。/n
【技术特征摘要】
1.一种企业风险识别模型的构建方法,其特征在于,包括以下步骤:
获取样本公司的关联方网络图谱结构,所述样本公司包括黑样本和白样本;
基于图挖掘算法StructuretoVector对样本公司的网络结构进行编码,获得样本公司网络结构的风险特征;
学习获得的风险特征,构建所述企业风险识别模型。
2.根据权利要求1所述的方法,其特征在于,所述基于图挖掘算法StructuretoVector对样本公司的网络结构进行编码,获得样本公司网络结构的风险特征的步骤,包括:
将样本公司的网络图谱结构转换为多个关键字典;
基于所述关键字典,将样本公司的关联方网络图谱中的各个节点映射为序号符号;
统计各个节点的序号符号出现的次数,并将序号符号作为特征,特征的取值即为该序号符号出现的次数,得到以序号符号为特征的向量,即特征向量。
3.根据权利要求2所述的方法,其特征在于,所述学习获得的风险特征,构建所述企业风险识别模型的步骤,包括:
利用所述特征向量对线性支持向量机模型进行训练,得到所述企业风险识别模型。
4.根据权利要求1所述的方法,其特征在于,所述获取样本公司的关联方网络图谱结构的步骤,包括:
通过爬虫技术获取样本公司及其关联方的数据,并运用图谱构建方法搭建样本公司的关联方网络图谱结构。
5.根据权利要求1所述的方法,其特征在于,所述企业风险为企业空壳风险,所述黑样本为若干个空壳公司,所述白...
【专利技术属性】
技术研发人员:史晓春,周凡吟,王福政,陈文,曾途,吴桐,
申请(专利权)人:成都数联铭品科技有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。