一种适用于校验企业代码的系统及方法技术方案

技术编号:32873590 阅读:26 留言:0更新日期:2022-04-02 12:04
本发明专利技术公开了一种适用于校验企业代码的系统及方法,属于数据处理技术领域。本发明专利技术系统,包括:赋码模块,所述赋码模块对目标企业所属的行业类别进行分类,分类完成后对目标企业赋予企业行业代码;采集模块,所述采集模块根据所述目标企业的企业行业代码,生成目标企业的信息采集表;检验模块,所述校验模块根据所述指标项数据预测目标企业的企业代码,若企业代码与所述赋码模块赋予目标企业的企业行业代码一致,则目标企业的企业代码校验通过。本发明专利技术方法中提供了全新的自动赋码机制,通过TF

【技术实现步骤摘要】
一种适用于校验企业代码的系统及方法


[0001]本专利技术涉及数据处理
,并且更具体地,涉及一种适用于校验企业代码的系统及方法。

技术介绍

[0002]行业分类是指按照《国民经济行业分类标准(2017)》所规定的全社会经济活动的分类与代码,对企业的经济活动进行分类,以满足在统计、计划、财政、税收、工商等国家宏观管理中,实现信息处理和信息交换。目前企业的行业代码获取方式,是在企业工商注册环节根据企业所填写的经营范围和其主要活动即生产经营中占其单位增加值份额最大的一种活动来确定其行业代码,这种方式可以理解为在企业生命周期起始阶段进行赋码,虽然通过现有的文本分类技术和机器学习技术可以实现自动分类。但这种分类方法及分类系统,无法确定企业在未实际发生生产经营活动时所描述主营业务活动是否准确,因此在不考虑自动分类准确率的基础上,仍需辅助业务人员进行人工干预及修正。并且随着我国经济发展进入新常态,企业生产经营多元化、动态化,如现代服务业、高技术服务业、生产性服务业、生活性服务业、科技服务业等。一方面使行业分类更加复杂,一方面单一的行业代码无法满足统计对本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种适用于校验企业代码的系统,所述系统包括:赋码模块,所述赋码模块对目标企业所属的行业类别进行分类,分类完成后对目标企业赋予企业行业代码;采集模块,所述采集模块根据所述目标企业的企业行业代码,生成目标企业的信息采集表;所述信息采集表采集目标企业的指标项数据;检验模块,所述校验模块根据所述指标项数据预测目标企业的企业代码,若企业代码与所述赋码模块赋予目标企业的企业行业代码一致,则目标企业的企业代码校验通过。2.根据权利要求1所述的系统,所述赋码模块对目标企业所属的行业类别进行分类,具体包括如下步骤:获取目标企业业务活动数据,将所述业务活动数据作为样本数据;对所述样本数据进行分词;针对分词后的样本数据,基于TF

IDF算法提取分词后的样本数据的特征值;将所述特征值输入至GBDT模型,对目标企业业务活动进行分类;根据所述目标企业的业务活动,对所述目标企业所属的行业类别进行分类。3.根据权利要求2所述的系统,所述对所述样本数据进行分词,使用jieba分词工具进行分词,所述分词具体为:剔除样本数据中的无用词,并通过样本数据中词语的词性,保留样本数据的动词和名词。4.根据权利要求1所述的系统,所述采集模块,包括:报表制作单元、报表发送单元和报表填报单元;报表制作单元,提供可视化报表制作组件,用于初始化不同行业代码所对应的企业信息采集表;报表发送单元,根据目标企业所对应的行业代码,自动发送企业信息采集表到目标企业;报表填报单元,用于查看需填报的目标企业信息采集表,填写企业信息采集表中对应的指标项数据。5.根据权利要求1所述的系统,所述根据指标...

【专利技术属性】
技术研发人员:吴伟刚时光倪冉孙少平于舜诰潘竞旭鲁龙
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1