The embodiment of the invention discloses a method and device for merchant name resolution, including the method of analyzing the business name: word segmentation according to the business to get to the merchant dictionary name; judgment according to the segmentation results the merchant name has a single structure or double structure; structure analysis of single or double structure of the merchant name according to the judgment result. The embodiment of the invention, by introducing the business name analytic method and the device, able to calculate the multiple business name is the same as businesses, whether they belong to a chain of businesses, whether affiliated merchants belong to the same family businesses, and the accurate classification of businesses, improve the accuracy of address resolution.
【技术实现步骤摘要】
本专利技术涉及互联网
,尤其涉及一种商户名称解析方法和装置。
技术介绍
随着互联网的日益普及,互联网服务对我们生活中的衣食住用行造成着 越来越大的影响。互联网服务中的本地搜索引擎服务给我们的日常生活带来了很大的便 利。在本地搜索引擎服务中,需要采集海量的商户名称进行处理。但是由于 互联网以及人们日常生活中对商户名称的表述方式是多种多样的,而且在互 联网上对同一商户名称的表述也非常复杂,例如同一商户具有多个商户名称, 同一连锁商户的商户名称相似,属于同一商户的附属商户的商户名称相似, 给我们处理这些商户名称时带来了很多麻烦。
技术实现思路
本专利技术实施例的目的是提供一种商户名称解析方法和装置,能够计算多 个商户名称是否为同一家商户,是否属于同一家连锁商户,是否属于同一家 商户的附属商户,并对商户进行准确分类。为实现上述目的,本专利技术实施例提供了一种,包括根据商户词典对获取到的商户名称进行分词;根据分词结果判断所述商户名称是属于单结构还是双结构;根据上述判断的结果对所述商户名称进行单结构解析或双结构解析。本专利技术实施例还提供了一种商户名称解析装置,包括分割模块,用于根据商户词典对获取到的商户名称进行分词;5识别模块,用于根据分词结果判断所述商户名称是属于单结构还是双结构;解析模块,用于根据上述判断的结果对所述商户名称进行单结构解析或 双结构解析。本专利技术实施例通过引入上述的商户名称解析方法,能够计算多个商户名 称是否为同一家商户,是否属于同一家连锁商户,是否属于同一家商户的附 属商户,并对商户进行准确分类,提高了地址解析的准确度。下面通过附图和实 ...
【技术保护点】
一种商户名称解析方法,其特征在于包括: 根据商户词典对获取到的商户名称进行分词; 根据分词结果判断所述商户名称是属于单结构还是双结构; 根据上述判断的结果对所述商户名称进行单结构解析或双结构解析。
【技术特征摘要】
1、一种商户名称解析方法,其特征在于包括根据商户词典对获取到的商户名称进行分词;根据分词结果判断所述商户名称是属于单结构还是双结构;根据上述判断的结果对所述商户名称进行单结构解析或双结构解析。2、 根据权利要求1所述的商户名称解析方法,其特征在于,所述商户词 典包括商户主干词典、商户属性词典、热点商户区域地址词典、商户组织 形式词典、商户组织特征词词典、基本词词典和组合词词典。3、 根据权利要求1所述的商户名称解析方法,其特征在于,对所述商户 名称进行单结构解析具体为 解析商户名称的行政区划,所述行政区划为省、市、乡三级行政区划;根据商户主干词典获取商户主干;根据商户属性词典获取商户属性;根据商户组织形式词典获取商户组织形式;将商户名称中无法识别的部分》丈入商户名称补充。4、 根据权利要求3所述的商户名称解析方法,其特征在于,所述根据商 户主干词典获取商户主干具体为根据商户主干词典通过最长匹配原则获取商户主干和通过最短匹配原则 获取最短商户主干,遇到商户属性词或商户组织形式词后停止匹配。5、 根据权利要求l所述的商户名称解析方法,其特征在于,所述对所述 商户名称进行双结构解析具体为解析商户名称的行政区划,所述行政区划为省、市、乡三级行政区划;根据商户主干词典获取商户主干;根据商户属性词典获取商户属性;根据商户组织形式词典获取商户组织形式;才艮据商户组织特征词词典和商户组织形式词典,获取商户组织的附属初」构的前缀修饰语和商户组织的附属机构;将商户名称中无法识别的部分放入商户名称补充。6、 根据权利要求l-5任一所述的...
【专利技术属性】
技术研发人员:周利民,段剑波,王思锋,张步峰,
申请(专利权)人:爱帮聚信北京信息技术有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。