一种组织机构代码中经济行业自动分类的装置制造方法及图纸

技术编号:11331769 阅读:98 留言:0更新日期:2015-04-22 22:15
本发明专利技术涉及一种组织机构代码中经济行业自动分类的装置,包括如下模块:(1)分类规则维护模块,主要包括,构建存储类别特征词集,行业类别体系及产业体系,形成数字化标准分类体系,进行类别管理,词典管理及主题与范式管理;(2)小文本分类模块,对训练语料进行测试、比较与分析得小文本对照参照模型;(3)建立词表模块,通过分析词间关系,抽象出更小范围的关系基本信息、关系性质、关系的关联,通过组配的方式创建、描述词间关系;(4)智能检索模块,对查询语句进行语义分解,并且对各种模糊输入加以分析,映射入已准备好的分类模型,并且对于可能存在的多分类方式与用户行为进行分析,最后得出每个分类的可能性,推荐给用户。

【技术实现步骤摘要】

本专利技术属于社会信息化领域,尤其涉及一种组织机构代码中经济行业自动分类的 目.0
技术介绍
组织机构代码是对中华人民共和国国内依法注册、依法登记的机关、企、事业单位、社会团体和民办非企业单位颁发的一个在全国范围内唯一的始终不变的代码标识,随着经济的不断发展,企业如雨后春笋般的出现,每个组织单位都需要办理代码证。在代码证生成过程中需要根据组织机构代码中的分类标准对企业进行行业归类。分类标准的应用为组织机构代码的管理工作带来了很多优势。目前最新的分类标准主要由二十个门类,进而再细分为更多的大、中、小类,其能够根据我国现有实际情况,细化分类,从而得以对信息进行更加详细的收集,完善企业经营分类体系,规范化企业经营范围,为国民经济核算和各项专业统计按照经济活动观察事物提供了详细、科学的分类依据。但目前,行业分类标准的应用仍存在着一定的缺陷。例如很多工作人员由于缺乏相应的专业知识,在划分组织机构相应的经济行业时,有时候会主观地加上自己的猜测和想法,而不是通过专业知识来对机构进行客观分类。这样会对行业分类质量造成很大的影响。另外,在行业分类的列表当中,有时候没有详细说明其划分依据,且没有全面列举相关的经济活动,并且经营机构的产业具有较广的经营范围,体现出较强的融合交叉性,因此经常无法在目前所推行的列表中找到相对应的行业。工作人员有时候根据自己的想法,对其类别进行划分,在这种情况下,有很多的机构被列入到一些没有明确分类的小类别当中。而且如果这些分类工作都通过人工来完成的话,不可避免地会出现人为错误和办证时间的加长。因此这就需要在划分类别时应该尽量降低主观因素的影响,扩大分类的空间,将零散分布状态变为集中可管理的映射模型,由映射模型对现有数据进行分类与维护,使得在输入经营范围或者属性名称时,可以快速找到正确类目,使得小文本随意数据规范化。本专利技术提出的一种组织机构代码中经济行业自动分类的方法从根本上提高了办事效率,排除人为的主观能力限制,且能科学地自动分类,便于按照产业统计来分析,有利于全国组织机构代码管理中心的产业经济政策分析和研宄。
技术实现思路
针对上述现有技术存在的问题,本专利技术提供一种组织机构代码中经济行业自动分类的装置,包括如下模块:(I)分类规则维护模块,主要包括,构建存储类别特征词集,行业类别体系及产业体系,形成数字化标准分类体系,进行类别管理,词典管理及主题与范式管理;(2)小文本分类模块,对训练语料进行测试、比较与分析得小文本对照参照模型;(3)建立词表模块,通过分析词间关系,抽象出更小范围的关系基本信息、关系性质、关系的关联,通过组配的方式创建、描述词间关系;(4)智能检索模块,对查询语句进行语义分解,并且对各种模糊输入加以分析,映射入已准备好的分类模型,并且对于可能存在的多分类方式与用户行为进行分析,最后得出每个分类的可能性,推荐给用户。智能检索模块中根据可能性由高到低推荐给用户。智能检索模块中根据最相关的信息计算最大分布进行推荐。本专利技术与现有技术相比具有以下优点和积极效果:(I)从根本上提高了经济行业自动分类的效率。(2)能够快速准确判断公司所属的经济行业分类,避免了由于人为原因造成的错误判定。(3)智能搜索将可能的分类结果排序推荐,可选择最优分类结果,若分类结果不满意还可手工进行分类。(4)类别信息的浏览、添加、删除和修改。(5)利用类别特征抽取算法进行语料测试。(6)建立基于知识的分类范式,建立行业分类体系。【具体实施方式】一种组织机构代码中经济行业自动分类的装置,包括如下模块:(I)分类规则维护模块,主要包括,构建存储类别特征词集,行业类别体系及产业体系,形成数字化标准分类体系,进行类别管理,词典管理及主题与范式管理;(2)小文本分类模块,对训练语料进行测试、比较与分析得小文本对照参照模型;(3)建立词表模块,通过分析词间关系,抽象出更小范围的关系基本信息、关系性质、关系的关联,通过组配的方式创建、描述词间关系;(4)智能检索模块,对查询语句进行语义分解,并且对各种模糊输入加以分析,映射入已准备好的分类模型,并且对于可能存在的多分类方式与用户行为进行分析,最后得出每个分类的可能性,推荐给用户。智能检索模块中根据可能性由高到低推荐给用户。智能检索模块中根据最相关的信息计算最大分布进行推荐。【主权项】1.一种组织机构代码中经济行业自动分类的装置,其特征在于包括如下模块: (1)分类规则维护模块,主要包括,构建存储类别特征词集,行业类别体系及产业体系,形成数字化标准分类体系,进行类别管理,词典管理及主题与范式管理; (2)小文本分类模块,对训练语料进行测试、比较与分析得小文本对照参照模型; (3)建立词表模块,通过分析词间关系,抽象出更小范围的关系基本信息、关系性质、关系的关联,通过组配的方式创建、描述词间关系; (4)智能检索模块,对查询语句进行语义分解,并且对各种模糊输入加以分析,映射入已准备好的分类模型,并且对于可能存在的多分类方式与用户行为进行分析,最后得出每个分类的可能性,推荐给用户。2.如权利要求书I中所述的装置,其特征在于:智能检索模块中根据可能性由高到低推荐给用户。3.如权利要求书I中所述的装置,其特征在于:智能检索模块中根据最相关的信息计算最大分布进行推荐。【专利摘要】本专利技术涉及一种组织机构代码中经济行业自动分类的装置,包括如下模块:(1)分类规则维护模块,主要包括,构建存储类别特征词集,行业类别体系及产业体系,形成数字化标准分类体系,进行类别管理,词典管理及主题与范式管理;(2)小文本分类模块,对训练语料进行测试、比较与分析得小文本对照参照模型;(3)建立词表模块,通过分析词间关系,抽象出更小范围的关系基本信息、关系性质、关系的关联,通过组配的方式创建、描述词间关系;(4)智能检索模块,对查询语句进行语义分解,并且对各种模糊输入加以分析,映射入已准备好的分类模型,并且对于可能存在的多分类方式与用户行为进行分析,最后得出每个分类的可能性,推荐给用户。【IPC分类】G06F17-30, G06Q40-00【公开号】CN104537561【申请号】CN201510026777【专利技术人】孙镇, 金江, 宫政, 袁辉, 孙泰, 李晟飞 【申请人】全国组织机构代码管理中心【公开日】2015年4月22日【申请日】2015年1月20日本文档来自技高网
...

【技术保护点】
一种组织机构代码中经济行业自动分类的装置,其特征在于包括如下模块:(1)分类规则维护模块,主要包括,构建存储类别特征词集,行业类别体系及产业体系,形成数字化标准分类体系,进行类别管理,词典管理及主题与范式管理;(2)小文本分类模块,对训练语料进行测试、比较与分析得小文本对照参照模型;(3)建立词表模块,通过分析词间关系,抽象出更小范围的关系基本信息、关系性质、关系的关联,通过组配的方式创建、描述词间关系;(4)智能检索模块,对查询语句进行语义分解,并且对各种模糊输入加以分析,映射入已准备好的分类模型,并且对于可能存在的多分类方式与用户行为进行分析,最后得出每个分类的可能性,推荐给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙镇金江宫政袁辉孙泰李晟飞
申请(专利权)人:全国组织机构代码管理中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1