一种基于深度异常检测的企业风险识别方法和系统技术方案

技术编号:35333946 阅读:22 留言:0更新日期:2022-10-26 11:53
本申请提出一种基于深度异常检测的企业风险识别方法和系统。方法包括:采集企业的基础信息,将基础信息处理为指标项,整合多个指标项构建结构化的企业信息表;对结构化的企业信息表中的各指标项的内在分布关系进行学习,构建指标项内异常的异常检测指标;对结构化的企业信息表中的指标项之间的相互关联关系进行学习,构建指标项间异常的异常检测指标;对企业的各指标项共同组成和反映的企业整体的结构化语义信息进行学习,构建结构化语义信息异常的异常检测指标;将上述三个层次的指标融合,构建综合异常检测指标;依据综合异常检测指标,得到企业异常评分。本发明专利技术具有构建层次化的异常检测指标体系,进而实现全方位、多层级的企业异常检测。级的企业异常检测。级的企业异常检测。

【技术实现步骤摘要】
一种基于深度异常检测的企业风险识别方法和系统


[0001]本申请属于企业风险识别研究领域,特别涉及一种基于深度异常检测的企业风险识别方法和系统。

技术介绍

[0002]目前对于企业风险的识别主要作用于金融机构在贷款、授信等业务领域。一般来说,企业风险识别的方式有两种。一种为基于企业交易信息的风险识别,此类方法多依据固化的规则,重点关注操作失误,因此识别风险单一、局限性较高。另一种则针对企业各项经营信息进行风险识别,然而由于模型主要应用于特定的业务领域,应用形式单一,难以分指标对风险进行区分识别,因此不具备全方位、多层次的企业异常检测能力。
[0003]异常检测算法旨在数据中发现不符合预期行为的数据模式。比如在银行风控领域,洗钱、信用卡欺诈、企业欺诈贷款等行为被认为是异常;在医疗异常检测领域,罕见病、虚假就医、医疗事故等被认为是异常。除此之外,异常检测在网络安全入侵检测、故障检测、视频监控中都有广泛的应用。在企业风险检测领域,异常检测可以提供企业经营异常的感知与警示。但是将异常检测算法应用到企业风险检测领域,还存在以下技术问题。一方面,如何将复杂的表格化企业数据转化为异常检测算法可使用的信息是一个难点。另一方面,大多数异常检测方法更关注结构化信息(比如图像的异常检测),却忽视了非结构化信息对于语义的影响。而在企业数据中,单指标(比如资产负债率)对于整体语义(比如企业经营状况)往往起着决定性的作用。
[0004]针对上述问题,本申请提供一种基于深度异常检测的企业风险识别方法和系统。

技术实现思路
<br/>[0005]为了解决所述现有技术的不足,本申请提供了一种基于深度异常检测的企业风险识别方法和系统,以解决上述技术问题。
[0006]本专利技术第一方面公开了一种基于深度异常检测的企业风险识别方法;所述方法包括:步骤S1、采集企业的基础信息,将所述基础信息处理为指标项,整合多个指标项构建结构化的企业信息表;步骤S2、对所述结构化的企业信息表中的各指标项的内在分布关系进行学习,构建指标项内异常的异常检测指标;步骤S3、对所述结构化的企业信息表中的指标项之间的相互关联关系进行学习,构建指标项间异常的异常检测指标;步骤S4、对企业的各指标项共同组成和反映的企业整体的结构化语义信息进行学习,构建结构化语义信息异常的异常检测指标;步骤S5、将所述指标项内异常的异常检测指标、指标项间异常的异常检测指标和结构化语义信息异常的异常检测指标融合,构建综合异常检测指标;
步骤S6、依据所述综合异常检测指标,得到企业异常评分。
[0007]根据本专利技术第一方面的方法,在所述步骤S6中,所述方法还包括:根据所述指标项内异常的异常检测指标、指标项间异常的异常检测指标和结构化语义信息异常的异常检测指标,确定企业风险的来源,所述企业风险的来源包括单指标项异常、指标项间的关联关系异常和企业数据整体呈现异常。
[0008]根据本专利技术第一方面的方法,在所述步骤S1中,所述将所述基础信息处理为指标项,整合多个指标项构建结构化的企业信息表的方法包括:将采集到的所述基础信息整理成一种三元组的形式化表示:,其中 表示家企业的集合,表示第家企业,表示个指标项的集合,是将企业映射到各指标项对应的指标值的函数集合,函数赋予一个企业特定的指标值,表示第个指标项的值域;在三元组形式化表示的基础上,构建企业信息表,具体过程为:将按纵向排列,将按横向排列,构建表格;将与在表格中对应位置的值赋予;在所述企业信息表中,第家企业的指标值表示为向量形式:。
[0009]根据本专利技术第一方面的方法,在所述步骤S2中,所述对所述结构化的企业信息表中的各指标项的内在分布关系进行学习,构建指标项内异常的异常检测指标的方法包括:采用频率统计的方法来反映各个指标值分布规律,将指标内分布关系学习过程转化为指标值的频率统计过程;对于各指标项,学习指标值分布函数 ,将指标项中的指标值映射为其出现的频率;构建指标项内异常的异常检测指标为:其中,表示第家企业的指标项内异常的异常检测指标,表示指标项的总数。
[0010]根据本专利技术第一方面的方法,在所述步骤S3中,所述对所述结构化的企业信息表中的指标项之间的相互关联关系进行学习,构建指标项间异常的异常检测指标的方法包括:采用单个指标项与其它指标项的互信息来反映各指标项间的共现规律,将指标项
之间的相互关联关系学习过程转化为指标项之间互信息衡量函数的学习过程;对于各指标项,学习其与其它指标项之间的互信息衡量函数,将指标项中的指标值,即,以及所述指标值对应其它指标项中的指标值所构成的向量 映射为指标值与所述指标值 对应其它指标项中的指标值之间的互信息大小;其中表示除外其它指标项构成向量的所在空间;构建指标项间异常的异常检测指标为:其中,表示第家企业的指标项间异常的异常检测指标,表示指标项的总数。
[0011]根据本专利技术第一方面的方法,在所述步骤S4中,所述对企业的各指标项共同组成和反映的企业整体的结构化语义信息进行学习,构建结构化语义信息异常的异常检测指标的方法包括:首先,构建个第四深度神经网络 ; 将归一化的结果转换到第个隐空间中;其中,将指标值归一化到

1到1之间;然后,构建第三深度神经网络,将和映射为深度空间的维向量,即和;为简化描述,记为,记为 ,在所述深度空间中,采用指数化的余弦相似度定义相似度度量函数,计算和的相似度;构建结构化语义信息异常的异常检测指标为:其中,表示第家企业的结构化语义信息异常的异常检测指标。
[0012]根据本专利技术第一方面的方法,在所述步骤S5中,所述将所述指标项内异常的异常
检测指标、指标项间异常的异常检测指标和结构化语义信息异常的异常检测指标融合,构建综合异常检测指标的方法包括:其中,第家企业的综合异常检测指标,表示第家企业的指标项内异常的异常检测指标,表示第家企业的指标项间异常的异常检测指标,表示第家企业的结构化语义信息异常的异常检测指标;表示的权重系数,为人为设置的超参数; 表示的权重系数,为人为设置的超参数;表示的权重系数,为人为设置的超参数。
[0013]本专利技术第二方面公开了一种基于深度异常检测的企业风险识别系统;所述系统包括:第一处理模块,被配置为,采集企业的基础信息,将所述基础信息处理为指标项,整合多个指标项构建结构化的企业信息表;第二处理模块,被配置为,对所述结构化的企业信息表中的各指标项的内在分布关系进行学习,构建指标项内异常的异常检测指标;第三处理模块,被配置为,对所述结构化的企业信息表中的指标项之间的相互关联关系进行学习,构建指标项间异常的异常检测指标;第四处理模块,被配置为,对企业的各指标项共同组成和反映的企业整体的结构化语义信息进行学习,构建结构化语义信息异常的异常检测指标;第五处理模块,被配置为,将所述指标项内异常的异常检测指标、指标项间异常的异常检测指标和结构化语义信息异常的异常检测指标融合,构建综合异常检测指标;第六处理模块,被配置为,依据所述综合异常检测指标,得到企业异常评分。
[0014]根据本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度异常检测的企业风险识别方法,其特征在于,所述方法包括:步骤S1、采集企业的基础信息,将所述基础信息处理为指标项,整合多个指标项构建结构化的企业信息表;步骤S2、对所述结构化的企业信息表中的各指标项的内在分布关系进行学习,构建指标项内异常的异常检测指标;步骤S3、对所述结构化的企业信息表中的指标项之间的相互关联关系进行学习,构建指标项间异常的异常检测指标;步骤S4、对企业的各指标项共同组成和反映的企业整体的结构化语义信息进行学习,构建结构化语义信息异常的异常检测指标;步骤S5、将所述指标项内异常的异常检测指标、指标项间异常的异常检测指标和结构化语义信息异常的异常检测指标融合,构建综合异常检测指标;步骤S6、依据所述综合异常检测指标,得到企业异常评分。2.根据权利要求1所述的一种基于深度异常检测的企业风险识别方法,其特征在于,在所述步骤S6中,所述方法还包括:根据所述指标项内异常的异常检测指标、指标项间异常的异常检测指标和结构化语义信息异常的异常检测指标,确定企业风险的来源,所述企业风险的来源包括单指标项异常、指标项间的关联关系异常和企业数据整体呈现异常。3.根据权利要求1所述的一种基于深度异常检测的企业风险识别方法,其特征在于,在所述步骤S1中,所述将所述基础信息处理为指标项,整合多个指标项构建结构化的企业信息表的方法包括:将采集到的所述基础信息整理成一种三元组的形式化表示:,其中表示N家企业的集合, o
i
表示第 i家企业,表示 D个指标项的集合,是将企业映射到各指标项对应的指标值的函数集合,函数赋予一个企业特定的指标值,表示第j个指标项的值域;在三元组形式化表示的基础上,构建企业信息表,具体过程为:将O按纵向排列,将A按横向排列,构建表格;将与在表格中对应位置的值赋予;在所述企业信息表中,第家企业的指标值表示为向量形式:。4.根据权利要求1所述的一种基于深度异常检测的企业风险识别方法,其特征在于,在所述步骤S2中,所述对所述结构化的企业信息表中的各指标项的内在分布关系进行学习,构建指标项内异常的异常检测指标的方法包括:采用频率统计的方法来反映各个指标值分布规律,将指标内分布关系学习过程转化为指标值的频率统计过程;对于各指标项,学习指标值分布函数,将指标项中的指标值
映射为其出现的频率;构建指标项内异常的异常检测指标为:其中,表示第家企业的指标项内异常的异常检测指标,表示指标项的总数。5.根据权利要求1所述的一种基于深度异常检测的企业风险识别方法,其特征在于,在所述步骤S3中,所述对所述结构化的企业信息表中的指标项之间的相互关联关系进行学习,构建指标项间异常的异常检测指标的方法包括:采用单个指标项与其它指标项的互信息来反映各指标项间的共现规律,将指标项之间的相互关联关系学习过程转化为指标项之间互信息衡量函数的学习过程;对于各指标项,学习其与其它指标项之间的互信息衡量函数,将指标项中的指标值,即,以及所述指标值对应其它指标项中的指标值所...

【专利技术属性】
技术研发人员:李倩江鑫雨郭红钰刘玉龙郑扬飞
申请(专利权)人:中国电子科技集团公司第十五研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1