一种基于用户地址信息的用户分类、用户识别方法及装置制造方法及图纸

技术编号:14911985 阅读:111 留言:0更新日期:2017-03-30 01:59
本申请公开了一种基于用户地址信息的用户分类、用户识别方法及装置,所述方法包括:获取待处理的用户地址信息,根据预设的区域信息库中包含的标准地址信息,对所述待处理的用户地址信息进行分类,得到所述标准地址信息对应的用户地址信息集合,每一所述标准地址信息表示一个地理区域,所述用户地址信息集合中包含至少一个所述待处理的用户地址信息。通过本方法,能够有效且准确地将用户地址信息按照不同的标准地址信息进行分类,分类后形成的用户地址信息集合中的用户地址信息均表征着同一地理区域,在此基础上,就可以准确地识别用户所属的具体地理区域。

【技术实现步骤摘要】

本申请涉及计算机
,尤其涉及一种基于用户地址信息的用户分类、用户识别方法及装置。
技术介绍
随着信息技术的发展,用户自身的用户地址信息(如:通讯地址等)已经成为一种重要的用户信息,对于用户而言,用户地址信息可使用户准确地获得相应的业务服务(如:物流寄送服务)。对于服务提供商(如:网站、电信运营商、银行等)而言,可以对用户地址信息进行分类,以确定出不同用户各自所属的地理区域,从而对用户提供相应的业务服务或对用户所属区域进行识别等。现有技术中,服务提供商对用户地址信息进行分类以识别用户,通常采用的方式为:提取用户地址信息中的关键词缀,根据关键词缀确定用户地址信息所属区域,进而确定用户所属区域。例如:假设用户地址信息为“XX市XX大学”、“教务处X室”,这些用户地址信息中的“大学”、“教务处”就是一种关键词缀,表明用户地址信息对应的区域是学校,因此将上述的用户地址信息划分为“学校”类。那么,也就可以识别出提供该用户地址信息的用户属于“学校”类的用户。但是,采用上述对用户地址信息进行分类以识别用户的方式,并不能满足实际应用中对用户精确识别的要求。例如:在医疗保险的出险服务中,服务提供本文档来自技高网...

【技术保护点】
一种基于用户地址信息的用户分类方法,其特征在于,包括:获取待处理的用户地址信息;根据预设的区域信息库中包含的标准地址信息,对所述待处理的用户地址信息进行分类,得到所述标准地址信息对应的用户地址信息集合,其中,每一个所述标准地址信息表示一个地理区域,所述用户地址信息集合中包含至少一个所述待处理的用户地址信息。

【技术特征摘要】
1.一种基于用户地址信息的用户分类方法,其特征在于,包括:获取待处理的用户地址信息;根据预设的区域信息库中包含的标准地址信息,对所述待处理的用户地址信息进行分类,得到所述标准地址信息对应的用户地址信息集合,其中,每一个所述标准地址信息表示一个地理区域,所述用户地址信息集合中包含至少一个所述待处理的用户地址信息。2.如权利要求1所述的用户分类方法,其特征在于,所述方法还包括:在得到所述标准地址信息对应的用户地址信息集合时,建立所述标准地址信息与所述用户地址信息集合之间的对应关系,其中,所述对应关系用于识别属于所述用户地址信息集合中的所述待处理的用户地址信息对应的用户所属的地理区域。3.如权利要求1所述的用户分类方法,其特征在于,根据预设的区域信息库中包含的标准地址信息,对所述待处理的用户地址信息进行分类,得到所述标准地址信息对应的用户地址信息集合,包括:从预设的区域信息库中选择一个标准地址信息,确定选择的所述标准地址信息中包含的标准地址词;对所述待处理的用户地址信息进行地址结构化处理,得到所述待处理的用户地址信息中包含的每一个地址词对应的地址索引词;根据所述标准地址词和所述待处理的用户地址信息中包含的每一个地址词对应的地址索引词,对所述待处理的用户地址信息进行分类,得到所述标准地址信息对应的用户地址信息集合。4.如权利要求3所述的用户分类方法,其特征在于,根据所述标准地址词和所述待处理的用户地址信息中包含的每一个地址词对应的地址索引词,对所述待处理的用户地址信息进行分类,得到所述标准地址信息对应的用户地址信息集合,包括:根据所述标准地址词,查找包含与所述标准地址词相匹配的地址索引词的待处理用户地址信息;将查找到的所述待处理用户地址信息作为所述标准地址信息对应的用户地址信息集合。5.如权利要求4所述的用户分类方法,其特征在于,根据所述标准地址词,查找包含与所述标准地址词相匹配的地址索引词的待处理用户地址信息,包括:根据所述标准地址词,查找与所述标准地址词相同的所述地址索引词;根据所述地址索引词,确定包含所述地址索引词的待处理的用户地址信息;对确定的所述待处理的用户地址信息进行筛选,得到筛选后的用户地址信息;对所述筛选后的用户地址信息进行排序,并根据排序结果,选择满足设定排序条件的用户地址信息,并将选择的所述用户地址信息作为查找到的待处理的用户地址信息。6.如权利要求5所述的用户分类方法,其特征在于,根据所述标准地址词,查找与所述标准地址词相同的所述地址索引词,包括:针对确定选择的所述标准地址信息中包含的标准地址词,选择满足设定条件的标准地址词;根据选择的所述标准地址词和所述待处理的用户地址信息中包含的每一个地址词对应的地址索引词,查找与选择的所述标准地址词相同的地址索引词。7.如权利要求5所述的用户分类方法,其特征在于,对确定的所述待处理的用户地址信息进行筛选,得到筛选后的用户地址信息,包括:针对确定的所述待处理的用户地址信息中包含的每一个所述待处理的用户地址信息,执行以下操作:选择其中一个所述待处理的用户地址信息,并确定选择的所述待处理的用户地址信息对应的第一经纬度;根据所述第一经纬度以及选择的所述标准地址信息对应的第二经纬度,计算所述第一经纬度以及所述第二经纬度之间的距离值;在得到确定的所述待处理的用户地址信息中包含的每一个所述待处理的用户地址信息对应的距离值时,筛选出距离值不大于设定门限值对应的所述待处理的用户地址信息,并将筛选出的所述待处理的用户地址信息作为筛选后的用户地址信息。8.如权利要求5所述的用户分类方法,其特征在于,对确定的所述待处理的用户地址信息进行筛选,得到筛选后的用户地址信息,包括:在确定选择的所述标准地址信息中包含的标准地址词的个数大于1时,确定每一个标准地址词的地理层级,选择地理层级不小于设定地理层级的标准地址词;根据选择的所述标准地址词,从确定的所述待处理的用户地址信息中,查找包含与选择的所述标准地址词相同的地址索引词的用户地址信息;将查找到的所述用户地址信息作为筛选后的用户地址信息。9.如权利要求5所述的用户分类方法,其特征在于,对所述筛选后的用户地址信息进行排序,包括:针对所述筛选后的用户地址信息中包含的每一个所述用户地址信息,执行以下操作:选择其中一个用户地址信息;确定选择的所述用户地址信息与确定选择的所述标准地址信息匹配的特征信息,其中,所述特征信息包括:经纬度信息、文本格式的地址信息、名称信息中的至少一种;按照预设的特征信息的优先级权重,确定选择的所述用户地址信息与确定选择的所述标准地址信息匹配的特征信息的优先级权重,以及根据选择的所述用户地址信息与确定选择的所述标准地址信息匹配的特征信息,计算选择的所述用户地址信息对应的特征值;根据所述特征值和所述优先级权重,确定选择的所述用户地址信息与确定选择的所述标准地址信息匹配的关联程度值;在得到所述筛选后的用户地址信息中包含的每一个所述用户地址信息的关联程度值时,根据所述关联程度值,对所述筛选后的用户地址信息进行排序。10.如权利要求9所述的用户分类方法,其特征在于,根据选择的所述用户地址信息与确定选择的所述标准地址信息匹配的特征信息,计算选择的所述用户地址信息对应的特征值,包括:当所述特征信息包括经纬度时,根据确定选择的所述标准地址信息对应的经纬度与选择的所述用户地址信息对应的经纬度,计算确定选择的所述标准地址信息与选择的所述用户地址信息之间的相似度,将所述相似度作为选择的所述用户地址信息对应的特征值;当所述特征信息包括文本格式的地址信息时,根据确定选择的所述标准地址信息中文本格式的地址信息与选择的所述用户地址信息中文本格式的地址信息,计算确定选择的所述标准地址信息与选择的所述用户地址信息之...

【专利技术属性】
技术研发人员:王教团
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1