一种规范企业名称的方法技术

技术编号:10408882 阅读:166 留言:0更新日期:2014-09-10 18:08
本发明专利技术公开了一种规范企业名称的方法,该方法包括以下步骤:接收销售数据中的企业名称与预先设置的企业信息数据库中的名称进行完全匹配;对于未匹配的企业名称,将企业名称进行乱码处理;根据名称规范性,进行附加信息清除;将符号文本化转化,去除销售数据中企业名称含有符号信息合理转化;进行数字标准化处理;名称分解处理,提取销售数据中有描述多个企业名称的数据进行逐个提取;根据字库进行语义转化;输出规范企业名称。本发明专利技术通过采用上述方法可以将销售数据中企业名称进行规范化处理,将原来含有符号、乱码以及附加信息等非名称信息处理掉,便于统计。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,该方法包括以下步骤:接收销售数据中的企业名称与预先设置的企业信息数据库中的名称进行完全匹配;对于未匹配的企业名称,将企业名称进行乱码处理;根据名称规范性,进行附加信息清除;将符号文本化转化,去除销售数据中企业名称含有符号信息合理转化;进行数字标准化处理;名称分解处理,提取销售数据中有描述多个企业名称的数据进行逐个提取;根据字库进行语义转化;输出规范企业名称。本专利技术通过采用上述方法可以将销售数据中企业名称进行规范化处理,将原来含有符号、乱码以及附加信息等非名称信息处理掉,便于统计。【专利说明】
本专利技术涉及销售数据中企业名称处理技术,尤其涉及到。
技术介绍
在对企业销售数据进行数据处理过程中,企业名称是否规范是为最终销售报表统计的精确度起到很大的关联作用。如果企业名称无法有效地规范,不仅影响整个作业过程的进度,同时也影响报表统计的精度,因此企业名称规范是非常必要。大多数情况下,企业规范名称的组成方式为:行政区+字号+行业特点+组织形式或者字号+行政区+行业特点+组织形式。公司名称中的行政区划是本企业所在地县级以上行政区划的名称或地名;公司名称中的字号是根据本企业的企业文化和特点而有投资人所共同商议的名称;公司名称中的行业特点只指投资人所经营的行业名称(根据工商局有关规定确立)公司名称中组织形式是根据企业经济活动性质与国家有关法律法规确定的例如:上海雷允上药业有限公司,名称的组成方式:行政区划:上海;字号:雷允上;行业特点:医药;组织形式:有限公司;而在真实企业进销存数据中,企业常常因为自身方便会在企业名称上添加不同的特殊标记,这些企业名称在统计分析时,需要将不标准的名称转换成规范标准的企业名称后进行后续操作。现阶段对于企业名称进行规范时,往往仅去掉名称中的乱码,而忽视了对数据名称规范性的整理,从而造成后续人工操作工作量巨大,整个过程的实现周期会非常长,企业需要为此花费相当多的资源进行处理。针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中的问题,本专利技术提出,能够有效果规范数据中的企业名称,方便统计。本专利技术的技术方案是这样实现的:根据本专利技术的一个方面,提供了,该方法包括以下步骤:接收销售数据中的企业名称与预先设置的企业信息数据库中的名称进行完全匹配;对于未匹配的企业名称,将企业名称进行乱码处理;根据名称规范性,进行附加信息清除;将符号文本化转化,去除销售数据中企业名称含有符号信息合理转化;进行数字标准化处理;名称分解处理,提取销售数据中有描述多个企业名称的数据进行逐个提取;根据字库进行语义转化,输出规范企业名称。优选的,所述进行数字标准化处理具体为:将销售数据中企业名称中含有数字的数据进行转换,统一将小写转换为大写。优选的,所述对企业名称中名称进行处理语义转化具体包括:I)、对专有名称进行转化;2)、对错字进行转换;3)、对繁体字进行转换。本专利技术通过采用上述方法可以将销售数据中企业名称进行规范化处理,将原来含有符号、乱码以及附加信息等非名称信息处理掉,便于统计。【专利附图】【附图说明】为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的规范企业名称的方法的流程图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了,该方法包括以下步骤:接收销售数据中的企业名称与预先设置的企业信息数据库中的名称进行完全匹配;对于未匹配的企业名称,将企业名称进行乱码处理;根据名称规范性,进行附加信息清除;将符号文本化转化,去除销售数据中企业名称含有符号信息合理转化;进行数字标准化处理;名称分解处理,提取销售数据中有描述多个企业名称的数据进行逐个提取;根据字库进行语义转化,输出规范企业名称。优选的,所述进行数字标准化处理具体为:将销售数据中企业名称中含有数字的数据进行转换,统一将小写转换为大写。优选的,所述对企业名称中名称进行处理语义转化具体包括:I)、对专有名称进行转化;2)、对错字进行转换;3)、对繁体字进行转换。本实施例提供的上述方法可以将销售数据中企业名称进行规范化处理,将原来含有符号、乱码以及附加信息等非名称信息处理掉,便于统计。以下参照附图并举具体实施例,对本专利技术进行详细说明。如图1所示,本专利技术方法包含如下步骤。步骤101,接受企业名称数据。步骤102,将接受的企业名称数据中企业名称与预先设置的企业信息数据库中的企业名称进行完全相似匹配,对完整匹配的数据,如果可以匹配执行步骤109,对于未匹配的企业名称执行步骤103。步骤103,对企业名称进行乱码处理;具体的,将名称中的非汉字及数字的乱码去除,举例说明:#北京怀柔中国人民解放军空军航空医学研究所附属医院(原:解放军466院李大夫 TEL:302% s)进行乱码处理后转换为:北京怀柔中国人民解放军空军航空医学研究所附属医院(原:解放军466院李大夫TEL:302)。步骤104,对企业名称中附加信息进行处理;具体的,将企业名称中附带的附加信息删除掉,如姓名、电话等,举例说明:1、北京怀柔中国人民解放军空军航空医学研究所附属医院(原:解放军466院李大夫 TEL:302); 转换为:北京怀柔中国人民解放军空军航空医学研究所附属医院(原:解放军466院)。2、1003776_蛘埠市第三人民医院,进行处理后转换为:蛘埠市第三人民医院。3、常平(Y)百福堂药店33563(G),进行处理后转换为转换为:常平百福堂药店。4、(Z Y H) 深圳横岗(Y)瑞草堂药业深竹分店556336,进行处理后转换为:深圳横岗瑞草堂药业深竹分店。步骤105,对企业名称中符号文本转化;具体的,将名称中不全的符号补全,举例说明:“北京怀柔中国人民解放军空军航空医学研究所附属医院(原::解放军466院)”,转换为:“北京怀柔中国人民解放军空军航空医学研究所附属医院(原:解放军第466院)”。步骤106,对企业名称中数字标准化处理;具体的,将数字统一由阿拉伯数字修改为汉字,举例说明:解放军466院转换为:解放军第四六六院。步骤107,对企业名称中名称分解处理;具体的,将复合的名称分解成两个名称,举例说明:北京怀柔解放军空军航空医学研究所附属医院(原:解放军第四六六院)分解为:1、北京怀柔解放军空军航空医学研究所附属医院2、原:解放军第四六六院步骤108,对企业名称中名称进行处理语义转化;这里面包含:1、对专有名称进行转化,举例说明:北京怀柔解放军空军航空医学研究所附属医院(原:解放军第四六六院)转化为:北京怀柔空军航空医学研究所附属医院(原:解放军第四六六院)。2、对错字进行转换:雷龙江宝泉岭农垦兴盛药店转换为:黑龙江宝泉岭农垦兴盛药店。3、对繁体字进行转换,举例说明:寳和堂大药房转换为:宝和堂大药房;步骤本文档来自技高网
...

【技术保护点】
一种规范企业名称的方法,其特征在于,该方法包括以下步骤:接收销售数据中的企业名称与预先设置的企业信息数据库中的名称进行完全匹配;对于未匹配的企业名称,将企业名称进行乱码处理;根据名称规范性,进行附加信息清除;将符号文本化转化,去除销售数据中企业名称含有符号信息合理转化;进行数字标准化处理;名称分解处理,提取销售数据中有描述多个企业名称的数据进行逐个提取;根据字库进行语义转化;输出规范企业名称。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄旭江
申请(专利权)人:上海倍通医药科技咨询有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1