【技术实现步骤摘要】
一种确定企业产业类别的方法
本申请涉及数据处理
,尤其涉及一种确定企业产业类别的方法。
技术介绍
随着互联网的蓬勃发展,企业信息已进入互联网时代,企业越来越多的信息被公开在互联网的各大免费平台上,例如工商登记信息、上市企业股市信息、企业财务信息、企业经营信息、企业风险信息、企业行政监管信息,这些信息像一个一个的孤岛散落在互联网的各个角落,如果要得到关注企业的产业类别,则需要到互联网的各大免费平台查询,人工将查询到的海量信息集中到一起,然后再将这些信息分类,得到企业的产业类别。然而,这种方式处理耗时长,无法及时更新企业信息,从而导致企业的产业类别信息不准确。现有技术提供了网络爬虫程序,该程序可以自动从互联网的免费平台抓取企业的信息,通过这种方式,可以及时获取到企业的最新信息,进而通过分类处理,得到企业的产业类别。现有技术还提供了将获取到的企业信息通过数据处理、信息建模等一定的技术手段进行归纳统计处理,从而得到企业的产业类别。上述方式虽然可以得到企业的产业类别,但是在分类处理的过程中,都是基于获取到的企业信息,没有从现有的维度延伸分析,导致得到的企业的产业类别不够准确,进一步影响用户体验。
技术实现思路
有鉴于此,本专利技术提供了一种确定企业产业类别的方法,提高企业分类的精度以及用户的体验度。本专利技术的技术方案具体是这样实现的:一种确定企业产业类别的方法,该确定企业产业类别的方法包括:设置二维产业标签矩阵,用于表示各个产业类别和产 ...
【技术保护点】
1.一种确定企业产业类别的方法,其特征在于,包括:/n设置二维产业标签矩阵,用于表示各个产业类别和产业标签的关系;所述二维产业标签矩阵包括多个产业单元;所述每个产业单元中设置一个或多个产业标签,每个产业标签均包括:一个或多个特征词;/n获取待分类企业的N个年度的企业信息;所述N为大于1的整数;/n将所获取的待分类企业的N个年度的企业信息分别与所述二维产业标签矩阵中的每一个产业标签进行匹配,得到与N个年度的企业信息对应的N个匹配结果;/n根据所述N个匹配结果计算得到所述待分类企业的N个产业特征趋势值;/n根据所述待分企业的N个产业特征趋势值确定待分企业的行业类别。/n
【技术特征摘要】
1.一种确定企业产业类别的方法,其特征在于,包括:
设置二维产业标签矩阵,用于表示各个产业类别和产业标签的关系;所述二维产业标签矩阵包括多个产业单元;所述每个产业单元中设置一个或多个产业标签,每个产业标签均包括:一个或多个特征词;
获取待分类企业的N个年度的企业信息;所述N为大于1的整数;
将所获取的待分类企业的N个年度的企业信息分别与所述二维产业标签矩阵中的每一个产业标签进行匹配,得到与N个年度的企业信息对应的N个匹配结果;
根据所述N个匹配结果计算得到所述待分类企业的N个产业特征趋势值;
根据所述待分企业的N个产业特征趋势值确定待分企业的行业类别。
2.根据权利要求1所述的确定企业产业类别的方法,其特征在于,
为所述产业标签设置一个对应的权重。
3.根据权利要求1所述的确定企业产业类别的方法,其特征在于,该方法还进一步包括:
对所述企业信息进行处理,使得所述企业信息具有预先设置的信息格式。
4.根据权利要求1所示的确定企业产业类别的方法,其特征在于,所述将所获取的待分类企业的N个年度的企业信息分别与所述二维产业标签矩阵中的产业标签进行匹配包括:
为所述二维产业标签矩阵中的每一个产业标签均设置N个产业标签匹配记录,所述N个产业标签匹配记录分别对应于N个年度的企业信息;
对于每一个年度的企业信息,将企业信息与所述二维产业标签矩阵中的每一个产业标签的特征词匹配,并将匹配结果存储在与该产业标签所对应的该年度的企业信息对应的产业标签匹配记录中;
根据每一个产业标签匹配记录的匹配标识数据计算得到每一个产业标签匹配记录的匹配值;
根据每一个产业标签匹配记录的匹配值得到与N个年度的企业信息对应的N个匹配结果。
5.根据权利要求4所示的确定企业产业类别的方法,其特征在于,所述对于每一个年度的企业信息,将企业信息与所述二维产业标签矩阵中的每一个产业标签的特征词匹配,并将匹配结果存储在与该产业标签所对应的该年度的企业信息对应的产业标签匹配记录中包括:
将所企业信息进行分组,形成M组分组信息,并为每组分组信息设置相应的分组权重;所述M为自然数;
将每一组分组信息分别与所述二维产业标签矩阵中的每一个产业标签中的特征词进行匹配,并将匹配结果存储在该产业标签所对应的该年度的企业信息对应的产业标签匹配记录中。
6.根据权利要求5所示的确定企业产业类别的方法,其特征在于,所述将每一组分组信息分别与所述二维产业标签矩阵中的每一个产业标签中的特征词进行匹配,并将匹...
【专利技术属性】
技术研发人员:李永良,石娜,项明涛,
申请(专利权)人:中伯伦北京信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。