一种企业疑似实际控制人征信方法及系统技术方案

技术编号:26304189 阅读:15 留言:0更新日期:2020-11-10 19:59
本发明专利技术涉及图论算法领域,具体提供了一种企业疑似实际控制人征信方法及系统。与现有技术相比,本发明专利技术的一种企业疑似实际控制人征信方法,具有以下步骤:S01、数据的采集;S02、数据的预处理;S03、有向图的任意两点路径遍历;S04、对遍历出的路径进行股权穿透计算。本发明专利技术基于有向图的企业疑似实际控制人征信模型,可以解决征信研究的难点之一,为企业征信提供决策支持,具有良好的推广价值。

【技术实现步骤摘要】
一种企业疑似实际控制人征信方法及系统
本专利技术涉及图论算法领域,具体提供一种企业疑似实际控制人征信方法及系统。
技术介绍
征信是依法收集、整理、保存、加工自然人、法人及其他组织的信用信息,并对外提供信用报告、信用评估和信用信息咨询等服务,帮助客户判断、控制信用风险,进行信用管理的活动。2013年3月,《征信业管理条例》正式实施,明确中国人民银行为征信业监督管理部门,征信业步入有法可依的轨道。随着大数据的应用日臻成熟,征信业也迎来了蓬勃发展。实际控制人的追溯是企业征信分析的重要指标之一。如何利用图论算法来解决企业实际控制人追溯是本专利技术要解决的问题。
技术实现思路
本专利技术是针对上述现有技术的不足,提供一种实用性强的企业疑似实际控制人征信方法。本专利技术进一步的技术任务是提供一种设计合理、安全适用的企业疑似实际控制人征信系统。本专利技术解决其技术问题所采用的技术方案是:一种企业疑似实际控制人征信方法,具有以下步骤:S01、数据的采集;S02、数据的预处理;S03、有向图的任意两点路径遍历;S04、对遍历出的路径进行股权穿透计算。进一步的,在步骤S01中,包括:S011、提出数据采集需求;S012、爬虫开发;S013、爬虫部署;S014、爬虫配置。进一步的,在步骤S011中,根据数据分析业务需要,找出符合要求的数据源,然后确定每一个数据源的数据维度,制定采集的规则。进一步的,在步骤S012中,通过外包来实现爬虫开发的问题;在步骤S013中,爬虫服务器配置管理,大量IP配置管理;在步骤S014中,为前期开发的爬虫工具,根据网站特征进行参数配置,实施数据采集。进一步的,在步骤S02中,包括数据抽取与清洗,当数据不完整时,进行补全数据;当不同来源的数据出现重复的情况,进行去除重复记录,仅保留一条;同一个指标出现多个来源的数据,且数值不一样时,采用最权威渠道的数据;数据与常识不符时,设定判定规则;不同来源的不同指标实际的内涵与表示意义是不一样时,建立数据体系。进一步的,在步骤S03中,包括:S031、将始点设置为已访问,将其入栈;S032、查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点;S033、如果有,则将找到的这个节点入栈;S034、如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;S035、当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点;重复执行S032至S035,直到栈中元素为空。进一步的,在步骤S04中,对遍历出的所有路径进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。进一步的,在步骤S04中,对遍历出的所有路径进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。一种企业疑似实际控制人征信系统,包括数据采集模块、数据预处理模块、两点路径遍历模块和股权穿透计算模块;所述数据采集模块用于采集数据、爬虫开发、爬虫部署和爬虫配置,进行分析所需的数据支撑;所述数据预处理模块用于数据的抽取、清洗、去重、设定判定规则和建立数据体系,以达到数据的完整性、唯一性、权威性、合法性和一致性;所述两点路径遍历模块用于将始点设置为已访问,将其入栈,查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点,如果有,则将找到的这个节点入栈;如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点,直到栈中元素为空;所述股权穿透计算模块用于对遍历出的所有路径,进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。本专利技术的一种企业疑似实际控制人征信方法及系统和现有技术相比,具有以下突出的有益效果:本专利技术基于有向图的企业疑似实际控制人征信模型,可以解决征信研究的难点之一,为企业征信提供决策支持。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图1是一种企业疑似实际控制人征信方法中有向图的示意图;附图2是一种企业疑似实际控制人征信方法中数据采集和预处理的流程示意图。具体实施方式为了使本
的人员更好的理解本专利技术的方案,下面结合具体的实施方式对本专利技术作进一步的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本专利技术保护的范围。下面给出一个最佳实施例:如图1、2所示,本实施例中的企业疑似实际控制人征信方法,具有以下步骤:S01、数据的采集;S02、数据的预处理;S03、有向图的任意两点路径遍历;S04、对遍历出的路径进行股权穿透计算。在步骤S01中,包括:S011、提出数据采集需求:根据数据分析业务需要,找出符合要求的数据源,然后确定每一个数据源的数据维度,制定采集的规则。S012、爬虫开发:主要的难题是验证码识别,一般需要外包实现。S013、爬虫部署:主要是爬虫服务器配置管理,大量IP(HTTP代理、VPN代理等)配置管理。S014、爬虫配置:主要为前期开发的爬虫工具,根据网站特征进行参数配置,实施数据采集。在步骤S02中,包括数据抽取与清洗,解决数据质量问题:数据的完整性:比如人的属性中缺少性别、籍贯、年龄等,可以采取数据补全的方法。数据的唯一性:比如不同来源的数据出现重复的情况,去除重复记录,只保留一条。数据的权威性:比如同一个指标出现多个来源的数据,且数值不一样,可以采取最权威渠道的数据。数据的合法性:比如数据与常识不符,市区内开车速度到达400km/h,可以设定判定规则。数据的一致性:比如不同来源的不同指标,实际的内涵与表示意义不一样,可以建立数据体系。在步骤S03中,包括:S031、将始点设置为已访问,将其入栈;S032、查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点;S033、如果有,则将找到的这个节点入栈;S034、如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;S035、当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点;重复执行S032至本文档来自技高网
...

【技术保护点】
1.一种企业疑似实际控制人征信方法,其特征在于,具有以下步骤:/nS01、数据的采集;/nS02、数据的预处理;/nS03、有向图的任意两点路径遍历;/nS04、对遍历出的路径进行股权穿透计算。/n

【技术特征摘要】
1.一种企业疑似实际控制人征信方法,其特征在于,具有以下步骤:
S01、数据的采集;
S02、数据的预处理;
S03、有向图的任意两点路径遍历;
S04、对遍历出的路径进行股权穿透计算。


2.根据权利要求1所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S01中,包括:
S011、提出数据采集需求;
S012、爬虫开发;
S013、爬虫部署;
S014、爬虫配置。


3.根据权利要求2所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S011中,根据数据分析业务需要,找出符合要求的数据源,然后确定每一个数据源的数据维度,制定采集的规则。


4.根据权利要求3所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S012中,通过外包来实现爬虫开发的问题;
在步骤S013中,爬虫服务器配置管理,大量IP配置管理;
在步骤S014中,为前期开发的爬虫工具,根据网站特征进行参数配置,实施数据采集。


5.根据权利要求1所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S02中,包括数据抽取与清洗,当数据不完整时,进行补全数据;
当不同来源的数据出现重复的情况,进行去除重复记录,仅保留一条;
同一个指标出现多个来源的数据,且数值不一样时,采用最权威渠道的数据;
数据与常识不符时,设定判定规则;
不同来源的不同指标实际的内涵与表示意义是不一样时,建立数据体系。


6.根据权利要求1所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S03中,包括:
...

【专利技术属性】
技术研发人员:王文佳邢荣宋培东
申请(专利权)人:浪潮卓数大数据产业发展有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1