【技术实现步骤摘要】
企业行业信息处理方法、装置、电子设备及可读存储介质
本公开涉及一种企业行业信息处理方法、装置、电子设备及存储介质。
技术介绍
目前,对于行业分类有较多应用,但构建行业多级分类体系方法不一,但普遍存在因行业数据量大,需要大量的训练耗时。另外,利用现有的行业分类模型进行行业多级分类时,存在分类结果不准确的问题。
技术实现思路
为了解决上述技术问题中的至少一个,本公开提供了一种企业行业信息处理方法,包括:获得行业分类体系,其中所述行业分类体系被构建为多级树状结构,所述多级树状结构的每一级结构包括多个行业类别,并且所述多级树状结构的上一级结构的每个上一级行业类别分别对应下一级结构中的一个行业类别范围,其中所述行业类别范围包括一个以上下一级行业类别;基于输入的企业信息数据,预测企业在第N级结构中所属的行业类别,其中N≥1;根据在第N级结构中所预测的所属行业类别选择第N+1级结构中的行业类别范围;在所选择的第N+1级结构的行业类别范围内,根据企业信息数据来预测企业在第N+1级结构中所属 ...
【技术保护点】
1.一种企业行业信息处理方法,其特征在于,包括:/n获得行业分类体系,其中所述行业分类体系被构建为多级树状结构,所述多级树状结构的每一级结构包括多个行业类别,并且所述多级树状结构的上一级结构的每个上一级行业类别分别对应下一级结构中的一个行业类别范围,其中所述行业类别范围包括一个以上下一级行业类别;/n基于输入的企业信息数据,预测企业在第N级结构中所属的行业类别,其中N≥1;/n根据在第N级结构中所预测的所属行业类别选择第N+1级结构中的行业类别范围;/n在所选择的第N+1级结构的行业类别范围内,根据企业信息数据来预测企业在第N+1级结构中所属的行业类别;以及/n在所述第N+ ...
【技术特征摘要】
1.一种企业行业信息处理方法,其特征在于,包括:
获得行业分类体系,其中所述行业分类体系被构建为多级树状结构,所述多级树状结构的每一级结构包括多个行业类别,并且所述多级树状结构的上一级结构的每个上一级行业类别分别对应下一级结构中的一个行业类别范围,其中所述行业类别范围包括一个以上下一级行业类别;
基于输入的企业信息数据,预测企业在第N级结构中所属的行业类别,其中N≥1;
根据在第N级结构中所预测的所属行业类别选择第N+1级结构中的行业类别范围;
在所选择的第N+1级结构的行业类别范围内,根据企业信息数据来预测企业在第N+1级结构中所属的行业类别;以及
在所述第N+1级结构不是所述多级树状结构的最下级结构的情况下,根据第N+1级结构中所预测的所属行业类别选择第N+2级结构中的行业类别范围,并且在所选择的第N+2级结构的行业类别范围内,根据企业信息数据来预测企业在第N+2级结构中所属的行业类别,直至预测至所述多级树状结构的最下级结构的行业类别。
2.如权利要求1所述的方法,其特征在于,针对所述多级树状结构中被用来预测的每级结构,分别使用一个分类预测模型来在每级结构中预测企业所属的行业类别。
3.如权利要求1或2所述的方法,其特征在于,所述多级树状结构为四级树状结构,其中,
基于输入的企业信息数据,预测企业在第二级结构中所属的行业类别;
根据在第二级结构中所预测的所属行业类别选择第三级结构中的行业类别范围;
在所选择的第三级结构的行业类别范围内,根据企业信息数据来预测企业在第三级结构中所属的行业类别;
根据第三级结构中所预测的所属行业类别选择第四级结构中的行业类别范围;
在所选择的第四级结构的行业类别范围内,根据企业信息数据来预测企业在第四级结构中所属的行业类别,并且输出企业在第四级结构所属的行业类别作为最终预测的行业类别。
4.如权利要求2或3所述的方法,其特征在于,还包括训练用于相应级结构的分类预测模型,其中包括:
获取企业信息数据;
对所获取的企业信息数据进行处理,以构建用于训练的训练集,其中对预测所使用的每级结构分别构建训练集;以及
基于所构建的训练集对分类预测模型进行训练,以便使用训练后的分类预测模型来预测企业所属的行业类别。
5.如权利要求2至4中任一项所述的方法,其特征在于,在获取企业信息数据时,通过获取企业的工商信息来获取所述企业数据信息、和/或通过搜索引擎来获取所述企业数据信息。
<...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:北京网核精策科技管理中心有限合伙,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。