名称数据处理方法及装置制造方法及图纸

技术编号:15792721 阅读:360 留言:0更新日期:2017-07-10 01:46
本申请提供一种名称数据处理方法及装置。方法包括:获取待处理名称数据;对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息。本申请可以解决名称数据的识别问题,达到准确识别名称数据的目的。

【技术实现步骤摘要】
名称数据处理方法及装置
本申请涉及数据处理
,尤其涉及一种名称数据处理方法及装置。
技术介绍
在实际应用中,用户可能需要对各种名称数据进行管理。例如,在企业的客户关系管理(CustomerRelationshipManagement,CRM)系统中,需要管理大量客户的企业名称。例如,在旅游行业的信息系统中,需要管理大量旅游景点名称。例如,在教育系统中,需要管理所在辖区甚至是全国范围内的学校名称。例如,在一些销售商的信息库中,需要管理各地的特产名称等。各种名称在注册时的规则较多,另外,相关业务人员在录入系统时采用的标准可能不同,例如有些人员可能会录入简称,有些人员可能会录入全称,这些都会在管理上带来一定困难。为了解决名称数据管理过程中的困难,首要问题是能够从机器的角度准确识别这些名称,而目前并没有很好的方案解决该问题。
技术实现思路
本申请的多个方面提供一种名称数据处理方法及装置,用以解决名称数据的识别问题,达到准确识别名称数据的目的。本申请的一方面,提供一种名称数据处理方法,包括:获取待处理名称数据;对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息。本申请的另一方面,提供一种名称数据处理装置,包括:获取模块,用于获取待处理名称数据;第一确定模块,用于对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;第二确定模块,用于根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息。在本申请中,在获取待处理名称数据之后,对待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,从而确定待处理名称数据中的地域信息和后缀信息,进而根据确定出的地域信息和后缀信息,确定待处理名称数据中的个性化信息,实现对待处理名称数据的识别,为管理名称数据提供了便利条件。【附图说明】为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请一实施例提供的名称数据处理方法的流程示意图;图2为本申请另一实施例提供的名称数据处理装置的结构示意图;图3为本申请又一实施例提供的名称数据处理装置的结构示意图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请一实施例提供的名称数据处理方法的流程示意图。如图1所示,该方法包括:101、获取待处理名称数据。102、对上述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定待处理名称数据中的地域信息和后缀信息。103、根据上述待处理名称数据中的地域信息和后缀信息,确定待处理名称数据中的个性化信息。本实施例提供一种名称数据处理方法,用以实现对名称数据的解析,确定名称数据中的地域信息、后缀信息以及个性化信息,从而达到识别名称数据的目的,为名称数据的管理工作提供便利条件。本实施例提供的名称数据处理方法可以对任何名称数据进行处理,例如可以是企业名称、旅游景点名称、学校名称、地方特产名称等。相应的,执行该名称数据处理方法的装置(即名称数据处理装置)可以是位于各应用场景中的管理系统中实现,例如可作为CRM系统中的功能模块用以对企业名称进行识别,或者可作为旅游行业的信息系统中的功能模块用以对各旅游景点名称进行识别,等等。除此之外,名称数据处理装置也可以独立于各应用场景中的管理系统,但可以与各应用场景中的管理系统进行通信。为便于描述和区分,本实施例将需要进行处理的名称数据称为待处理名称数据。在需要识别名称数据的应用场景中,名称数据处理装置获取待处理名称数据。例如用户可以手动输入待处理名称数据,或者是名称数据处理装置可以根据处理指令,从其它设备上读取待处理名称数据。在获取待处理名称数据之后,名称数据处理装置可以对待处理名称数据进行识别。一般来说,名称数据都有一定的命名规则。当然根据应用场景的不同,名称数据的命名规则也会有所不同。以企业名称为例,一般包括行政区域、字号以及行业特征等信息,行政区域用于指示企业所在地,可理解为名称数据中的地域信息;字号一般是指企业自己设置的个性化信息;行业特征用于指示企业类别或属性,属于名称数据中的后缀。例如,以温州市三明电器有限公司为例,温州市属于地域信息,三明电器属于个性化信息,而有限公司属于后缀信息。以旅游景点名称为例,一般会包括景点所在地,景点所属类型以及一些类似“景区”、“风景区”、“度假村”等后缀信息。常见的旅游景点名称有陕西华山风景区、山东泰山风景名胜区、北京大兴区野生动物园、北京香山植物园等。由上述分析可知,对于主要包括地域信息、个性化信息以及后缀信息的名称数据,对这些名称数据的识别过程实际上就是确定这些名称数据中的地域信息、个性化信息以及后缀信息的过程。具体的,名称数据处理装置对待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定待处理名称数据中的地域信息和后缀信息,之后,根据所确定的地域信息和后缀信息,确定待处理名称数据中的个性化信息。值得说明的是,本实施例并不限定地域信息解析过程与后缀信息解析过程之间的执行顺序,可以并行执行,也可以顺序执行。在本实施例中,考虑到地域信息之间的层级关系,例如省、市、区/县,为了能够精确确定名称数据中的地域信息,本实施例对待处理名称数据在各地域层级上进行地域信息解析,以便解析出待处理名称数据中各地域层级上的地域信息。为了便于对名称数据进行地域信息解析,预先生成各地域层级对应的地域信息表。在各地域层级对应的地域信息表中,存储有对应地域层级上的所有地域信息。例如,以省对应的地域信息表为例,该地域信息表中存储有全国各省的名称或简称等可唯一标识具体省份的信息。可选的,地域信息表可以是hash表。优选的,可以取各地域信息中指定数量(例如3个)的字符作键值对中的键(key)。在对待处理名称数据进行地域信息解析之前,可以预先将各地域层级对应的地域信息表加载到缓存中,以便提高解析效率。另外,为了解析出待处理名称数据中的后缀信息,预先建立后缀信息表,该后缀信息表中存储有待处理名称数据所属应用场景中一些常见的后缀信息,例如有限公司、责任有限公司等。基于此,可以将待处理名称数据去除已经解析出的地域信息之后剩余的部分数据在后缀信息表中进行匹配,如果匹配到该剩余的部分数据中包含后缀信息表中某个后缀信息,则可以将该后缀信息作为待处理名称数据中的后缀信息。在一可选实施方式中,名称数据处理装置具体可以根据各地域层级对应的地域信息表,对待处理名称数据进行各地域层级上的地本文档来自技高网...
名称数据处理方法及装置

【技术保护点】
一种名称数据处理方法,其特征在于,包括:获取待处理名称数据;对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息。

【技术特征摘要】
1.一种名称数据处理方法,其特征在于,包括:获取待处理名称数据;对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息。2.根据权利要求1所述的方法,其特征在于,所述对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息,包括:根据各地域层级对应的地域信息表,对所述待处理名称数据进行各地域层级上的地域信息解析,以确定所述待处理名称数据中的地域信息;根据预设的后缀信息表,对所述待处理名称数据去除所述待处理名称数据中的地域信息后剩余的部分数据进行后缀信息解析,以确定所述待处理名称数据中的后缀信息。3.根据权利要求2所述的方法,其特征在于,所述根据各地域层级对应的地域信息表,对所述待处理名称数据进行各地域层级上的地域信息解析,以确定所述待处理名称数据中的地域信息,包括:按照地域层级由高到低的顺序,根据每一地域层级对应的地域信息表,对所述待处理名称数据进行每一地域层级上的地域信息解析,以确定所述待处理名称数据中每一地域层级上的地域信息;将所述待处理名称数据中每一地域层级上的地域信息进行组装,以获得所述待处理名称数据中的地域信息。4.根据权利要求3所述的方法,其特征在于,所述根据每一地域层级对应的地域信息表,对所述待处理名称数据进行每一地域层级上的地域信息解析,以确定所述待处理名称数据中每一地域层级上的地域信息,包括:将所述待处理名称数据或所述待处理名称数据去除当前地域层级之前已解析出的各地域层级上的地域信息后剩余的部分数据作为待匹配数据;按照从左到右的顺序,从所述待匹配数据中读取指定数量的字符;判断所述指定数量的字符是否存在于当前地域层级对应的地域信息表中;当所述指定数量的字符存在于当前地域层级对应的地域信息表中时,将所述指定数量的字符作为所述待处理名称数据在当前地域层级上的地域信息,并进入下一地域层级上的地域信息解析流程或后缀信息解析流程;当所述指定数量的字符不存在于当前地域层级对应的地域信息表中时,进入下一地域层级上的地域信息解析流程或后缀信息解析流程。5.根据权利要求4所述的方法,其特征在于,所述将所述指定数量的字符作为所述待处理名称数据在当前地域层级上的地域信息之前,包括:判断所述待处理名称数据是否具有上一地域层级上的地域信息;若所述待处理名称数据具有上一地域层级上的地域信息,判断所述指定数量的字符与上一地域层级上的地域信息是否满足所属关系;若所述待处理名称数据不具有上一地域层级上的地域信息,或者所述指定数量的字符与上一地域层级上的地域信息满足所属关系,将所述指定数量的字符作为所述待处理名称数据在当前地域层级上的地域信息。6.根据权利要求5所述的方法,其特征在于,还包括:若所述指定数量的字符与上一地域层级上的地域信息不满足所属关系,进入下一地域层级上的地域信息解析流程或后缀信息解析流程,并输出匹配异常警示信息。7.根据权利要求1所述的方法,其特征在于,所述根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息,包括:将所述待处理名称数据去除所述待处理名称数据中的地域信息和后缀信息后剩余的部分数据,作为所述待处理名称数据中的初始个性化信息;根据预设的自定义规则表,将所述待处理名称数据中的初始个性化信息中的指定字符去除或用正则表达式进行替换,以获得所述待处理名称数据中的个性化信息。8.根据权利要求1所述的方法,其特征在于,所述对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息之前,包括:根据预设的自定义规则表,将所述待处理名称数据中的指定字符去除或用正则表达式替换。9.根据权利要求1-8任一项所述的方法,其特征在于,在确定所述待处理名称数据中的地域信息、后缀信息和个性化信息之后,还包括:根据所述待处理名称数据中的地域信息、后缀信息和个性化信息,在名称数据库中进行匹配;若未在所述名称数据中匹配到与所述待处理名称数据中的地域信息、后缀信息和个性化信息对应的名称数据,将所述待处理名称数据存储到所述名称数据库中。10.根...

【专利技术属性】
技术研发人员:徐四维
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1