【技术实现步骤摘要】
名称数据处理方法及装置
本申请涉及数据处理
,尤其涉及一种名称数据处理方法及装置。
技术介绍
在实际应用中,用户可能需要对各种名称数据进行管理。例如,在企业的客户关系管理(CustomerRelationshipManagement,CRM)系统中,需要管理大量客户的企业名称。例如,在旅游行业的信息系统中,需要管理大量旅游景点名称。例如,在教育系统中,需要管理所在辖区甚至是全国范围内的学校名称。例如,在一些销售商的信息库中,需要管理各地的特产名称等。各种名称在注册时的规则较多,另外,相关业务人员在录入系统时采用的标准可能不同,例如有些人员可能会录入简称,有些人员可能会录入全称,这些都会在管理上带来一定困难。为了解决名称数据管理过程中的困难,首要问题是能够从机器的角度准确识别这些名称,而目前并没有很好的方案解决该问题。
技术实现思路
本申请的多个方面提供一种名称数据处理方法及装置,用以解决名称数据的识别问题,达到准确识别名称数据的目的。本申请的一方面,提供一种名称数据处理方法,包括:获取待处理名称数据;对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息。本申请的另一方面,提供一种名称数据处理装置,包括:获取模块,用于获取待处理名称数据;第一确定模块,用于对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;第二确定模块,用于根据所述待处理 ...
【技术保护点】
一种名称数据处理方法,其特征在于,包括:获取待处理名称数据;对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息。
【技术特征摘要】
1.一种名称数据处理方法,其特征在于,包括:获取待处理名称数据;对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息;根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息。2.根据权利要求1所述的方法,其特征在于,所述对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息,包括:根据各地域层级对应的地域信息表,对所述待处理名称数据进行各地域层级上的地域信息解析,以确定所述待处理名称数据中的地域信息;根据预设的后缀信息表,对所述待处理名称数据去除所述待处理名称数据中的地域信息后剩余的部分数据进行后缀信息解析,以确定所述待处理名称数据中的后缀信息。3.根据权利要求2所述的方法,其特征在于,所述根据各地域层级对应的地域信息表,对所述待处理名称数据进行各地域层级上的地域信息解析,以确定所述待处理名称数据中的地域信息,包括:按照地域层级由高到低的顺序,根据每一地域层级对应的地域信息表,对所述待处理名称数据进行每一地域层级上的地域信息解析,以确定所述待处理名称数据中每一地域层级上的地域信息;将所述待处理名称数据中每一地域层级上的地域信息进行组装,以获得所述待处理名称数据中的地域信息。4.根据权利要求3所述的方法,其特征在于,所述根据每一地域层级对应的地域信息表,对所述待处理名称数据进行每一地域层级上的地域信息解析,以确定所述待处理名称数据中每一地域层级上的地域信息,包括:将所述待处理名称数据或所述待处理名称数据去除当前地域层级之前已解析出的各地域层级上的地域信息后剩余的部分数据作为待匹配数据;按照从左到右的顺序,从所述待匹配数据中读取指定数量的字符;判断所述指定数量的字符是否存在于当前地域层级对应的地域信息表中;当所述指定数量的字符存在于当前地域层级对应的地域信息表中时,将所述指定数量的字符作为所述待处理名称数据在当前地域层级上的地域信息,并进入下一地域层级上的地域信息解析流程或后缀信息解析流程;当所述指定数量的字符不存在于当前地域层级对应的地域信息表中时,进入下一地域层级上的地域信息解析流程或后缀信息解析流程。5.根据权利要求4所述的方法,其特征在于,所述将所述指定数量的字符作为所述待处理名称数据在当前地域层级上的地域信息之前,包括:判断所述待处理名称数据是否具有上一地域层级上的地域信息;若所述待处理名称数据具有上一地域层级上的地域信息,判断所述指定数量的字符与上一地域层级上的地域信息是否满足所属关系;若所述待处理名称数据不具有上一地域层级上的地域信息,或者所述指定数量的字符与上一地域层级上的地域信息满足所属关系,将所述指定数量的字符作为所述待处理名称数据在当前地域层级上的地域信息。6.根据权利要求5所述的方法,其特征在于,还包括:若所述指定数量的字符与上一地域层级上的地域信息不满足所属关系,进入下一地域层级上的地域信息解析流程或后缀信息解析流程,并输出匹配异常警示信息。7.根据权利要求1所述的方法,其特征在于,所述根据所述待处理名称数据中的地域信息和后缀信息,确定所述待处理名称数据中的个性化信息,包括:将所述待处理名称数据去除所述待处理名称数据中的地域信息和后缀信息后剩余的部分数据,作为所述待处理名称数据中的初始个性化信息;根据预设的自定义规则表,将所述待处理名称数据中的初始个性化信息中的指定字符去除或用正则表达式进行替换,以获得所述待处理名称数据中的个性化信息。8.根据权利要求1所述的方法,其特征在于,所述对所述待处理名称数据进行各地域层级上的地域信息解析以及后缀信息解析,以确定所述待处理名称数据中的地域信息和后缀信息之前,包括:根据预设的自定义规则表,将所述待处理名称数据中的指定字符去除或用正则表达式替换。9.根据权利要求1-8任一项所述的方法,其特征在于,在确定所述待处理名称数据中的地域信息、后缀信息和个性化信息之后,还包括:根据所述待处理名称数据中的地域信息、后缀信息和个性化信息,在名称数据库中进行匹配;若未在所述名称数据中匹配到与所述待处理名称数据中的地域信息、后缀信息和个性化信息对应的名称数据,将所述待处理名称数据存储到所述名称数据库中。10.根...
【专利技术属性】
技术研发人员:徐四维,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。