企业综合信用信息查验方法、系统、介质、计算机设备技术方案

技术编号:27595563 阅读:19 留言:0更新日期:2021-03-10 10:15
本发明专利技术属于计算机应用技术领域,公开了一种企业综合信用信息查验方法、系统、介质、计算机设备,采集多源数据,进行数据的融合、分类处理与整合;将整合的数据划分为静态数据与动态数据;对静态数据进行分析,对动态数据进行挖掘、划分;对静态数据与动态数据分别进行处理,并基于静态数据与动态数据的处理结果生成企业综合信用查验报告。本发明专利技术通过采集多源数据,对数据分类处理与整合,统一存储于数据资源池中,各个交易平台能够共享共用数据池中的数据,弥补现有大宗商品交易平台垂直单一的缺点,结合动静态数据分类处理,对数据进行综合分析,生成企业综合信用查验报告。生成企业综合信用查验报告。生成企业综合信用查验报告。

【技术实现步骤摘要】
企业综合信用信息查验方法、系统、介质、计算机设备


[0001]本专利技术属于计算机应用
,尤其涉及一种企业综合信用信息查验方法、系统、介质、计算机设备。

技术介绍

[0002]目前,大宗商品是指可进入流通领域,但非零售环节,具有商品属性并用于工农业生产与消费使用的大批量买卖的物质商品。在金融投资市场,大宗商品指同质化、可交易、被广泛作为工业基础原材料的商品,如原油、有色金属、钢铁、农产品、铁矿石、煤炭等。包括3个类别,即能源商品、基础原材料和农副产品。
[0003]现有大宗商品交易市场的交易平台之间存在单一性、缺乏关联性等。一方面,企业安全指数难以保障,交易平台垂直单一不易发现数据背后隐藏的异常;另一方面不同大宗商品种类有着不同的交易平台,海量数据难以实现共享,很多重要信息无法关联挖掘,必然造成数据的浪费。在当今快速发展的大数据时代,运用数据挖掘分析技术可挖掘海量数据中的隐性信息,需要基于大宗商品交易平台研究一种跨平台信息可共享、企业主体属性相关联、动静态数据相结合的企业综合信用查验方法。系统查验结果最终以企业综合信用查验报告呈现,该查验报告包括四部分内容:(1)、基本信息,是指与企业的基础信息,如企业名称、企业组织机构代码、统一社会信用代码等;(2)、关联信息,是与该企业与之关联的企业的信息;(3)、综合信用评分信息,是运用数据挖掘分析技术、聚类降维以及AHP层次分析算法结合得到的综合信用评分信息;(4)、其他信息,指对一个企业信用影响度较大或其至关重要的信息。
[0004]通过上述分析,现有技术存在的问题及缺陷为:现有大宗商品交易市场的交易平台之间存在单一性、缺乏关联性;现有大宗商品交易市场的交易平台之间存在单一性、缺乏关联性,导致市场管理平台不规范、不集中、安全性低等问题,导致平台之间模式垂直单一,数据难以共享,主体缺乏关联等问题。
[0005]解决以上问题及缺陷的难度为:海量数据难以实现共享,很多重要信息无法关联挖掘,不易发现数据背后隐藏的异常。
[0006]解决以上问题及缺陷的意义为:平台间关联性更紧密,企业数据信用更准确,企业交易主体更安全,对市场管理或各交易平台监督性更高。

技术实现思路

[0007]针对现有技术存在的问题,本专利技术提供了一种企业综合信用信息查验方法、系统、介质、计算机设备。
[0008]本专利技术是这样实现的,一种企业综合信用信息查验方法,所述企业综合信用信息查验方法包括:
[0009]步骤一,采集多源数据,将多源数据进行融合,存储于数据池中,进行数据分类处理与整合;
[0010]步骤二,将数据池中整合的数据划分为用于生成基本信息数据的静态数据与用于生成关联信息数据、综合信用评分数据、其他重要数据的动态数据;
[0011]步骤三,对静态数据进行分析,对动态数据进行企业主体关联属性及相关数据的挖掘,并基于挖掘的数据对动态数据进行指标数据划分;
[0012]步骤四,对静态数据与动态数据分别进行处理,并基于静态数据与动态数据的处理结果生成企业综合信用查验报告。
[0013]进一步,步骤一中,所述多源数据包括:各平台历史交易数据、权威机构数据、第三方接口数据以及其他数据。
[0014]进一步,步骤二中,所述动态数据包括:
[0015]所述动态数据用于生成关联信息数据、综合信用评分数据、其他重要数据;
[0016]所述关联信息数据用于生成关联信息;
[0017]所述综合信用评分数据用于生成综合信用评分及各一级指标数据评分维度所占综合信用评分的比重;
[0018]所述其他重要数据用于生成企业相对重要的信息;
[0019]所述综合信用评分数据由动态数据处理得到;
[0020]所述关联信息数据以及其他重要数据依据动态数据中第三方接口数据或由其他源数据分别生成。
[0021]进一步,步骤三中,所述基于挖掘的数据对动态数据进行指标数据划分包括:
[0022]基于挖掘得到的企业主体关联属性确定的各企业属性之间的关联性即相关性系数,根据确定的相关性系数进行动态数据的聚类降维划分,将动态数据抓取生成三级指标数据,再由三级指标数据聚类降维生成二级指标数据,再由二级指标数据聚类降维生成一级指标数据。
[0023]进一步,步骤四中,所述对静态数据处理包括:将采集静态数据提取整理为规范化的基本信息。
[0024]进一步,步骤四中,所述对动态数据处理方法包括:
[0025](1)从处理整合的数据池中获取所需海量动态数据,将动态数据再整合,为数据结构化作准备;
[0026](2)将获取到的动态数据信息进行抓取、整理、降维、结构化;
[0027](3)对结构化处理好的数据进行数据挖掘与分析,分析二指标数据中的关联信息、信用影响因素比例及其他数据,确定二级指标数据各属性之间的相关性系数即企业主体属性之间的关联性;
[0028](4)依据该相关性系数运用层次分析算法计算出二级指标数据各属性的权重,依据权重进行K-means聚类降维,生成一级指标数据即决定信用评分的评分维度;
[0029](5)确定一级指标数据各维度之间的相关性系数,运用AHP算法确定各维度的权重,为各维度进行权重分配,并利用综合信用评分值计算公式计算综合信用评分值,并计算各维度在综合信用评分值中所占的比例,得到综合信用评分数据。
[0030]进一步,所述步骤(2)进一步包括:
[0031](1)从处理整合的数据池中获取所需海量动态数据,将动态数据再整合,为数据结构化作准备;
[0032](2)将获取到的动态数据信息进行抓取、整理、降维、结构化;
[0033](2.1)抓取企业属性关联性相对较大的属性,形成必要数据,再将数据进行清洗,预处理,整理出三级指标;数据预处理过程包括:数据清洗,数据变换,数据规约;其中数据清洗主要是对数据源中各属性在数值上的各种异常情况的进行处理,其中对某些异常值进行丢弃,对缺失值使用具有代表性的中位数、平均数或其他数值代替,将数据补充完整;数据变换将数据进行离散化和二元化。离散化主要是把各数据源中提取后清洗的数据进行离散划分,离散为各个不同的区间,二元化将两种状态区分,在数值上可定义为0或1,表示真或假,为数据规约做准备;数据规约减少数据源中的属性及各属性的数据量,初次降低数据的维度,删除无用信息或冗余数据,整理出三级指标数据;
[0034](2.2)由三级指标数据经过算法分析计算,对数据进行量化,确定量化三级指标数据各属性的相关性系数;所述由三级指标数据经过算法分析计算,对数据进行量化包括:对三级指标数据进行归一化,将所有指标数据统一在一个量级;
[0035]所述对三级指标数据进行归一化包括:对三级指标数据中的数值型指标以及离散型直接利用归一化公式进行归一化处理;对三级指标数据中的字符型指标将部分等级数据转换成对应的数值之后再利用归一化公式进行归一化处理;
[0036]所述归一化公式为:
...

【技术保护点】

【技术特征摘要】
1.一种企业综合信用信息查验方法,其特征在于,所述企业综合信用信息查验方法包括:采集多源数据,将多源数据进行融合,存储于数据池中,进行数据分类处理与整合;将数据池中整合的数据划分为用于生成基本信息数据的静态数据与用于生成关联信息数据、综合信用评分数据、其他重要数据的动态数据;对静态数据进行分析,对动态数据进行企业主体关联属性及相关数据的挖掘,并基于挖掘的数据对动态数据进行指标数据划分;对静态数据与动态数据分别进行处理,并基于静态数据与动态数据的处理结果生成企业综合信用查验报告。2.如权利要求1所述企业综合信用信息查验方法,其特征在于,所述多源数据包括:各平台历史交易数据、权威机构数据、第三方接口数据以及其他数据。3.如权利要求1所述企业综合信用信息查验方法,其特征在于,所述动态数据包括:所述动态数据用于生成关联信息数据、综合信用评分数据、其他重要数据;所述关联信息数据用于生成关联信息;所述综合信用评分数据用于生成综合信用评分及各一级指标数据评分维度所占综合信用评分的比重;所述其他重要数据用于生成企业相对重要的信息;所述综合信用评分数据由动态数据处理得到;所述关联信息数据以及其他重要数据依据动态数据中第三方接口数据或由其他源数据分别生成。4.如权利要求1所述企业综合信用信息查验方法,其特征在于,所述基于挖掘的数据对动态数据进行指标数据划分包括:基于挖掘得到的企业主体关联属性确定的各企业属性之间的关联性即相关性系数,根据确定的相关性系数进行动态数据的聚类降维划分,将动态数据抓取生成三级指标数据,再由三级指标数据聚类降维生成二级指标数据,再由二级指标数据聚类降维生成一级指标数据。5.如权利要求1所述企业综合信用信息查验方法,其特征在于,所述对静态数据处理包括:将采集静态数据提取整理为规范化的基本信息;所述企业综合信用查验报告包括:所述企业综合信用查验报告包括基本信息、关联信息、综合信用评分信息、其他信息;所述基本信息为与企业有关的基础信息,包括企业名称、企业组织机构代码、统一社会信用代码;所述关联信息,为与企业关联的其他企业的信息;所述其他信息,为对一个企业信用影响度较大或其至关重要的信息。6.如权利要求1所述企业综合信用信息查验方法,其特征在于,所述对动态数据处理方法包括:(1)从处理整合的数据池中获取所需海量动态数据,将动态数据再整合,为数据结构化作准备;(2)将获取到的动态数据信息进行抓取、整理、降维、结构化;
(2.1)抓取企业属性关联性相对较大的属性,形成必要数据,再将数据进行清洗,预处理,整理出三级指标;数据预处理过程包括:数据清洗,数据变换,数据规约;其中数据清洗主要是对数据源中各属性在数值上的各种异常情况的进行处理,其中对某些异常值进行丢弃,对缺失值使用具有代表性的中位数、平均数或其他数值代替,将数据补充完整;数据变换将数据进行离散化和二元化。离散化主要是把各数据源中提取后清洗的数据进行离散划分,离散为各个不同的区间;二元化将两种状态区分,在数值上可定义为0或1,表示真或假,为数据规约做准备;数据规约减少数据源中的属性及各属性的数据量,初次降低数据的维度,删除无用信息或冗余数据,整理出三级指标数据;(2.2)由三级指标数据经过算法分析计算,对数据进行量化,确定量化三级指标数据各属性的相关性系数;所述由三级指标数据经过算法分析计算,对数据进行量化包括:对三级指标数据进行归一化,将所有指标数据统一在一个量级;所述对三级指标数据进行归一化包括:对三级指标数据中的数值型指标以及离散型直接利用归一化公式进行归一化处理;对三级指标数据中的字符型指标将部分等级数据转换成对应的数值之后再利用归一化公式进行归一化处理;所述归一化公式为:Yi=(Xi-Xmin)/(Xmax-Xmin);其中,Xi、Yi分别表示处理前后的指标项,Xmin表示该三级指标数据的最小值,Xmax表示该三级指标数据的最大值,最终得到量化好的三级指标数据;各属性间的相关性系数采用pearson相关性系数,反应的是主体的两个主体属性之间变化趋势的方向以及程度,其值范围为(-1,+1),0表示两个主体属性不相关,正值表示正相关,负值表示负相关,值越大表示相关性越强,pearson相关性系数的公式如下:P(X,Y)=cov(X,Y)/sX*sY;其中P(X,Y)为变量X和Y之间的相关性系数,cov(X,Y)为两个变量X、Y之间的协方差,sX*sY为两个属性变量的标准差乘积;(2.3)依据相关性系数进行K-means聚类降维,生成出二级指标数据,对二级指标数据进行结构化处理,处理成可供数据分析与挖掘的CSV文件、SQL文件、表...

【专利技术属性】
技术研发人员:李占利范伟朱莉张新煜刘林超李颖
申请(专利权)人:西安科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1