企业风险信息处理方法技术

技术编号:39825060 阅读:4 留言:0更新日期:2023-12-29 16:00
本申请提供一种企业风险信息处理方法

【技术实现步骤摘要】
企业风险信息处理方法、装置、设备及存储介质


[0001]本申请涉及金融领域或其他相关领域,尤其涉及一种企业风险信息处理方法

装置

设备及存储介质


技术介绍

[0002]企业在经营过程中可以会存在各种类型的风险,对于金融机构而言,为了保证自身经营的稳定性,需要提前对企业的风险进行预判,识别其风险高低程度

[0003]目前,企业风险信息识别整合一般根据企业注册信息中的企业名称

企业证件
(
统一社会代码

注册号

组织机构代码
)
与风险信息中的同类信息精确匹配来实现

[0004]但是,企业注册信息更新频度低,而在实际经营过程中企业可能会出现更名等场景,现有技术方案无法及时地识别改名后企业的风险信息,容易出现风险预判错误的情况


技术实现思路

[0005]本申请提供一种企业风险信息处理方法

装置

设备及存储介质,用以解决目前当企业信息发生变更时,容易出现无法及时地识别改名后企业的风险信息的技术问题

[0006]第一方面,本申请提供一种企业风险信息处理方法,包括:
[0007]获取与目标企业风险关联的基础属性信息

用户行为日志和埋点信息数据;
[0008]对所述基础属性信息进行预处理,获取基础属性特征;
[0009]根据所述用户行为日志和埋点信息数据,构建多维时序统计特征,所述多维时序统计特征用于表征用户模糊搜索的企业和点击查询的企业的匹配关系;
[0010]根据所述基础属性特征和多维时序统计特征,获取最近邻集合,所述最近邻集合中包括
K
个邻居,
K
为正整数,
K
个邻居用于表征所述匹配关系中与所述目标企业的距离满足预设条件的
K
个疑似匹配关系;
[0011]根据所述最近邻集合中的
K
个疑似匹配关系,对所述目标企业进行风险识别

[0012]第二方面,本申请提供一种企业风险信息处理装置,包括:
[0013]数据获取模块,用于获取与目标企业风险关联的基础属性信息

用户行为日志和埋点信息数据;
[0014]信息预处理模块,用于对所述基础属性信息进行预处理,获取基础属性特征;
[0015]特征构建模块,用于根据所述用户行为日志和埋点信息数据,构建多维时序统计特征,所述多维时序统计特征用于表征用户模糊搜索的企业和点击查询的企业的匹配关系;
[0016]集合获取模块,用于根据所述基础属性特征和多维时序统计特征,获取最近邻集合,所述最近邻集合中包括
K
个邻居,
K
为正整数,
K
个邻居用于表征所述匹配关系中与所述目标企业的距离满足预设条件的
K
个疑似匹配关系;
[0017]风险识别模块,用于根据所述最近邻集合中的
K
个疑似匹配关系,对所述目标企业进行风险识别

[0018]第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如上述的方法

[0019]第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的方法

[0020]本申请提供的企业风险信息处理方法

装置

设备及存储介质,通过结合基础属性特征和多维时序统计特征,计算模糊搜索某企业与点击查询某企业的匹配关系与目前通过工商注册信息精确匹配关系的最近的
k
个邻居,定位疑似匹配关系,可以实现动态识别企业风险,及时高效地提升金融机构的风险管控效果

附图说明
[0021]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理

[0022]图1为本申请实施例提供的企业照面信息的示意图;
[0023]图2为本申请实施例提供的企业风险信息处理方法的流程示意图;
[0024]图3为本申请实施例提供的数据预处理的流程示意图;
[0025]图4为本申请实施例提供的基础属性特征的构成示意图;
[0026]图5为本申请实施例提供的多维时序统计特征的构成示意;
[0027]图6为本申请实施例提供的企业风险信息识别的整体流程示意;
[0028]图7为本申请实施例提供的疑似匹配关系筛选示意图;
[0029]图8为本申请实施例提供的企业风险信息处理装置的结构示意图;
[0030]图9为本申请实施例提供的电子设备的结构示意图

[0031]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述

这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念

具体实施方式
[0032]这里将详细地对示例性实施例进行说明,其示例表示在附图中

下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素

以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式

相反,它们仅是与如所附权利要求书中所详述的

本申请的一些方面相一致的装置和方法的例子

[0033]需要说明的是,本申请所涉及的用户信息
(
包括但不限于用户设备信息

用户个人信息等
)
和数据
(
包括但不限于用于分析的数据

存储的数据

展示的数据等
)
,均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集

使用和处理需要遵守相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝

[0034]需要说明的是,本申请提供的企业风险信息处理方法

装置

设备及存储介质可用于金融
,也可用于除金融
之外的任意领域,本申请企业风险信息处理方法

装置

设备及存储介质的应用领域不作限定

[0035]图1为本申请实施例提供的企业照面信息的示意图,如图1所示,企业照面信息即
企业的营业执照上的照面信息,其通常包括有企业名本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种企业风险信息处理方法,其特征在于,包括:获取与目标企业风险关联的基础属性信息

用户行为日志和埋点信息数据;对所述基础属性信息进行预处理,获取基础属性特征;根据所述用户行为日志和埋点信息数据,构建多维时序统计特征,所述多维时序统计特征用于表征用户模糊搜索的企业和点击查询的企业的匹配关系;根据所述基础属性特征和多维时序统计特征,获取最近邻集合,所述最近邻集合中包括
K
个邻居,
K
为正整数,
K
个邻居用于表征所述匹配关系中与所述目标企业的距离满足预设条件的
K
个疑似匹配关系;根据所述最近邻集合中的
K
个疑似匹配关系,对所述目标企业进行风险识别
。2.
根据权利要求1所述的方法,其特征在于,所述用户行为日志和埋点数据包括:目标对应关系搜索次数

目标对应关系在预设时间段内的平均搜索次数

目标对应关系点击率

目标对应关系平均点击率

用户在页面的停留时间在第一目标时间范围区间的次数

用户访问深度

用户平均访问深度

搜索企业在第二目标时间范围区间重复搜索次数

页面跳出率,所述目标对应关系用于表征用户模糊搜索的企业与用户点击查询的企业的对应关系
。3.
根据权利要求1所述的方法,其特征在于,所述根据所述基础属性特征和多维时序统计特征,获取最近邻集合,包括:根据所述基础属性特征和多维时序统计特征,构建每个样本的特征向量;根据特征向量的余弦相似度,确定每个匹配关系与目标企业的距离;根据每个匹配关系与目标企业的距离,获取最近邻集合
。4.
根据权利要求1所述的方法,其特征在于,所述根据所述最近邻集合中的
K
个疑似匹配关系,对所述目标企业进行风险识别,包括:获取所述最近邻集合中每个疑似匹配关系的预测评分;将每个疑似匹配关系的预测评分作为梯度提升决策树算法的多分类器所需的预测空间进行集成,筛选出预测评分最高的疑似匹配关系,作为目标匹配关系;根据所述目标匹配关系,对所述目标企业进行信息整合,得到信息整合后的目标企业;对信息整合后的目标企业进行风险识别
。5.
根据权利要求1所述的方法,其特征在于,所述对所述基础属性信息进行预处理,包括:通过汉语语言模型
N

Gram
的分词算法对所述基础属性信息进行分词,提取得到待处理信息,所述待处理信息包括第一待处理信息和第二待处理信息;对所述第一待处理信息中的内容进行数据清洗;根据预设标准,对第二待处理信息的格式进行标准化处理,所述标准化处理包括地址标准化

联系电话标准化中的至少一种
。6.
根据权利要求5所述的方法,其特征在于,所述对所述第一待处理信息中的内容进行数据清洗,包括:将所述第一待处理信息中的空格删除;对所述第一待处理信...

【专利技术属性】
技术研发人员:胡慧丽林苏燕李展顾丹铭
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1