【技术实现步骤摘要】
识别企业所属行业的方法、装置、设备和介质
[0001]本专利技术涉及数据处理
,特别涉及识别企业所属行业的方法、装置、设备和介质。
技术介绍
[0002]国家宏观层面根据需要往往会对不同行业进行政策指导及扶持,因此需要一种能够快速准确地识别企业所属的行业的方法,从而满足银行对其进行信贷资源倾斜的需求。
[0003]目前,识别企业是否为特定行业的方法主要分两大类。一是人工规则类,根据外部管理办法、专家经验和业务发展趋势,将人工识别企业为某特定行业的知识固化成规则,利用该规则来识别企业是否属于某特定行业。二是学习模型类,利用深度学习模型来识别企业是否属于某特定行业。
[0004]然而,人工规则类中所使用的专家经验等知识往往具有主观性,不同的专家可能对企业所属行业的认知并不相同,并且外界环境及行业发展千变万化,固化的规则不一定能及时跟上外界的变化。学习模型类中所使用的深度学习模型的相关技术尚不成熟,实现难度较高,而且深度学习模型往往可解释性较差,不能满足银行的监管和审计要求。
技术实现思路
[ ...
【技术保护点】
【技术特征摘要】
1.一种识别企业所属行业的方法,其特征在于,所述方法用于电子设备,并且所述方法包括:获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合;将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配;当两者匹配时,确定该候选企业属于所述特定行业,否则确定该候选企业不属于所述特定行业。2.根据权利要求1所述的方法,其特征在于,所述获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合进一步包括:获取特定行业的头部企业集合,并且对于所述头部企业集合中的每个待处理的头部企业,获取与所述头部企业存在直接或间接密切交易关系的所有候选企业,并且将所述头部企业和获取到的所述所有候选企业添加到所述候选企业集合中,其中,获取在时间周期内与所述头部企业存在直接密切交易关系的第一候选企业,获取在时间周期内与所述第一候选企业存在直接密切交易关系的第二候选企业,以此类推,获取在时间周期内彼此存在直接密切交易关系的所有候选企业作为获取到的所述所有候选企业。3.根据权利要求1或2所述的方法,其特征在于,如果在时间周期内,第一企业与第二企业的交易总金额大于等于阈值,并且交易总次数大于等于阈值,则确定所述第一企业与所述第二企业存在直接密切交易关系。4.根据权利要求2所述的方法,其特征在于,基于企业间的供销关系来构建资金流向图,并且基于所述资金流向图来获取所述头部企业集合和所述候选企业集合,其中,所述资金流向图中的每个点指示企业以及该企业是否为所述特定行业中的头部企业,并且所述资金流向图中的每两个点之间的每条边指示对应企业之间的交易以及该笔交易的交易金额和交易时间。5.根据权利要求1所述的方法,其特征在于,所述将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配进一步包括:提取所述特定行业的所述行业说明和每个候选企业的所述经营范围中的关键字;将提取到的所有关键字进行特征矢量化;将特征矢量化后的所述行业说明中的所述关键字与所述经营范围中的所述关键字进行相似度计算;如果汇总后的相似度大于等于阈值,则确定所述行业说明与所述经营范围匹配。6.一种识别企业所属行业的装置,其特征在于,所述装置包括:获取模块,被配置为获取与特定行业中的头部企业存在直接或间接密切交易关系的候选企业集合;匹配模块,被配置为将所述特定行业的行业说明与所述候选企业集合中的每个候选企业的经营范围进行匹配;确定模块,被配置为当两者匹...
【专利技术属性】
技术研发人员:伏峰,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。