识别企业所属行业的方法、装置、设备和介质制造方法及图纸

技术编号:37351672 阅读:8 留言:0更新日期:2023-04-27 07:03
本发明专利技术涉及数据处理技术领域,特别涉及识别企业所属行业的方法、装置、设备和介质。本发明专利技术的方法包括:获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合;将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配;当两者匹配时,确定该候选企业属于所述特定行业,否则确定该候选企业不属于所述特定行业。本发明专利技术不完全以专家经验为依托,保证客观性,能及时应对外部环境和内部业务的发展变化,可以进一步提高行业识别的准确性和可调节性,可解释性较强,满足监管和审计要求,并且可以利用计算机及网络技术实施,实施成本低于学习模型类。实施成本低于学习模型类。实施成本低于学习模型类。

【技术实现步骤摘要】
识别企业所属行业的方法、装置、设备和介质


[0001]本专利技术涉及数据处理
,特别涉及识别企业所属行业的方法、装置、设备和介质。

技术介绍

[0002]国家宏观层面根据需要往往会对不同行业进行政策指导及扶持,因此需要一种能够快速准确地识别企业所属的行业的方法,从而满足银行对其进行信贷资源倾斜的需求。
[0003]目前,识别企业是否为特定行业的方法主要分两大类。一是人工规则类,根据外部管理办法、专家经验和业务发展趋势,将人工识别企业为某特定行业的知识固化成规则,利用该规则来识别企业是否属于某特定行业。二是学习模型类,利用深度学习模型来识别企业是否属于某特定行业。
[0004]然而,人工规则类中所使用的专家经验等知识往往具有主观性,不同的专家可能对企业所属行业的认知并不相同,并且外界环境及行业发展千变万化,固化的规则不一定能及时跟上外界的变化。学习模型类中所使用的深度学习模型的相关技术尚不成熟,实现难度较高,而且深度学习模型往往可解释性较差,不能满足银行的监管和审计要求。

技术实现思路

[0005]针对现有技术的上述问题,本专利技术的目的在于提供识别企业所属行业的方法、装置、设备和介质,不完全以专家经验为依托,保证客观性,能及时应对外部环境和内部业务的发展变化,可以进一步提高行业识别的准确性和可调节性,可解释性较强,满足监管和审计要求,并且可以利用计算机及网络技术实施,实施成本低于学习模型类。
[0006]为了解决上述问题,本专利技术提供一种识别企业所属行业的方法,其特征在于,所述方法用于电子设备,并且所述方法包括:
[0007]获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合;
[0008]将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配;
[0009]当两者匹配时,确定该候选企业属于所述特定行业,否则确定该候选企业不属于所述特定行业。
[0010]进一步地,所述获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合进一步包括:
[0011]获取特定行业的头部企业集合,并且对于所述头部企业集合中的每个待处理的头部企业,获取与所述头部企业存在直接或间接密切交易关系的所有候选企业,并且将所述头部企业和获取到的所述所有候选企业添加到所述候选企业集合中,其中,获取在时间周期内与所述头部企业存在直接密切交易关系的第一候选企业,获取在时间周期内与所述第一候选企业存在直接密切交易关系的第二候选企业,以此类推,获取在时间周期内彼此存在直接密切交易关系的所有候选企业作为获取到的所述所有候选企业。
[0012]进一步地,如果在时间周期内,第一企业与第二企业的交易总金额大于等于阈值,并且交易总次数大于等于阈值,则确定所述第一企业与所述第二企业存在直接密切交易关系。
[0013]进一步地,基于企业间的供销关系来构建资金流向图,并且基于所述资金流向图来获取所述头部企业集合和所述候选企业集合,其中,所述资金流向图中的每个点指示企业以及该企业是否为所述特定行业中的头部企业,并且所述资金流向图中的每两个点之间的每条边指示对应企业之间的交易以及该笔交易的交易金额和交易时间。
[0014]进一步地,所述将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配进一步包括:
[0015]提取所述特定行业的所述行业说明和每个候选企业的所述经营范围中的关键字;
[0016]将提取到的所有关键字进行特征矢量化;
[0017]将特征矢量化后的所述行业说明中的所述关键字与所述经营范围中的所述关键字进行相似度计算;
[0018]如果汇总后的相似度大于等于阈值,则确定所述行业说明与所述经营范围匹配。
[0019]本专利技术另一方面提供一种识别企业所属行业的装置,其特征在于,所述装置包括:
[0020]获取模块,被配置为获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合;
[0021]匹配模块,被配置为将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配;
[0022]确定模块,被配置为当两者匹配时,确定该候选企业属于所述特定行业,否则确定该候选企业不属于所述特定行业。
[0023]进一步地,所述获取模块进一步被配置为:
[0024]获取特定行业的头部企业集合,并且对于所述头部企业集合中的每个待处理的头部企业,获取与所述头部企业存在直接或间接密切交易关系的所有候选企业,并且将所述头部企业和获取到的所述所有候选企业添加到所述候选企业集合中,其中,获取在时间周期内与所述头部企业存在直接密切交易关系的第一候选企业,获取在时间周期内与所述第一候选企业存在直接密切交易关系的第二候选企业,以此类推,获取在时间周期内彼此存在直接密切交易关系的所有候选企业作为获取到的所述所有候选企业。
[0025]进一步地,如果在时间周期内,第一企业与第二企业的交易总金额大于等于阈值,并且交易总次数大于等于阈值,则确定所述第一企业与所述第二企业存在直接密切交易关系。
[0026]进一步地,基于企业间的供销关系来构建资金流向图,并且基于所述资金流向图来所述头部企业集合和获取所述候选企业集合,其中,所述资金流向图中的每个点指示企业以及该企业是否为所述特定行业中的头部企业,并且所述资金流向图中的每两个点之间的每条边指示对应企业之间的交易以及该笔交易的交易金额和交易时间。
[0027]进一步地,所述匹配模块进一步被配置为:
[0028]提取所述特定行业的所述行业说明和每个候选企业的所述经营范围中的关键字;
[0029]将提取到的所有关键字进行特征矢量化;
[0030]将特征矢量化后的所述行业说明中的所述关键字与所述经营范围中的所述关键
字进行相似度计算;
[0031]如果汇总后的相似度大于等于阈值,则确定所述行业说明与所述经营范围匹配。
[0032]本专利技术另一方面提供一种电子设备,所述电子设备包括存储有计算机可执行指令的存储器和处理器,所述处理器被配置为执行所述指令以实施上面描述的识别企业所属行业的方法。
[0033]本专利技术另一方面提供一种使用计算机程序编码的计算机存储介质,所述计算机程序包括指令,所述指令被计算机执行以实施上面描述的识别企业所属行业的方法。
[0034]本专利技术另一方面提供一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令被执行时,实现上面描述的识别企业所属行业的方法。
[0035]由于上述技术方案,本专利技术具有以下有益效果:
[0036]根据本专利技术实施例的识别企业所属行业的方法,考虑到人以群居物以类分,认为与某一特定行业中的头部企业存在直接或间接密切交易关系的企业,大概率与该特定行业有关联,例如位于该特定行业的供应链上下游等,因此首先找到这种企业作为候选企业集合,以供后续进行精细筛选;继续从企业工商数据中的经营范围入手,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别企业所属行业的方法,其特征在于,所述方法用于电子设备,并且所述方法包括:获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合;将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配;当两者匹配时,确定该候选企业属于所述特定行业,否则确定该候选企业不属于所述特定行业。2.根据权利要求1所述的方法,其特征在于,所述获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合进一步包括:获取特定行业的头部企业集合,并且对于所述头部企业集合中的每个待处理的头部企业,获取与所述头部企业存在直接或间接密切交易关系的所有候选企业,并且将所述头部企业和获取到的所述所有候选企业添加到所述候选企业集合中,其中,获取在时间周期内与所述头部企业存在直接密切交易关系的第一候选企业,获取在时间周期内与所述第一候选企业存在直接密切交易关系的第二候选企业,以此类推,获取在时间周期内彼此存在直接密切交易关系的所有候选企业作为获取到的所述所有候选企业。3.根据权利要求1或2所述的方法,其特征在于,如果在时间周期内,第一企业与第二企业的交易总金额大于等于阈值,并且交易总次数大于等于阈值,则确定所述第一企业与所述第二企业存在直接密切交易关系。4.根据权利要求2所述的方法,其特征在于,基于企业间的供销关系来构建资金流向图,并且基于所述资金流向图来获取所述头部企业集合和所述候选企业集合,其中,所述资金流向图中的每个点指示企业以及该企业是否为所述特定行业中的头部企业,并且所述资金流向图中的每两个点之间的每条边指示对应企业之间的交易以及该笔交易的交易金额和交易时间。5.根据权利要求1所述的方法,其特征在于,所述将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配进一步包括:提取所述特定行业的所述行业说明和每个候选企业的所述经营范围中的关键字;将提取到的所有关键字进行特征矢量化;将特征矢量化后的所述行业说明中的所述关键字与所述经营范围中的所述关键字进行相似度计算;如果汇总后的相似度大于等于阈值,则确定所述行业说明与所述经营范围匹配。6.一种识别企业所属行业的装置,其特征在于,所述装置包括:获取模块,被配置为获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合;匹配模块,被配置为将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配;确定模块,被配置为当两者匹...

【专利技术属性】
技术研发人员:伏峰
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1