【技术实现步骤摘要】
客户信息管理方法及装置
[0001]本说明书实施例涉及数据管理
,特别涉及一种客户信息管理方法
。
技术介绍
[0002]随着无纸化办公的普及,数据的数量越来越大,在公司内部可能会存在多套系统,并且这些系统之间的客户信息不同步,导致了信息更新困难的问题
。
[0003]当前,通常情况下是依靠人工根据一些简单的字符串匹配规则将各个系统之间的同一家客户的信息进行关联,这种方式非常耗时且容易出错或者遗漏
。
同一家客户的名称和地址的表述可能有非常多种,同一家客户的信息可能会有多种表述,这种情况下,通过简单的字符串规则判断客户是否属于同一家的方法错误率高,而使用人工判断的成本又高
。
所以,需要一种精准的自动匹配客户信息的信息管理方法
。
技术实现思路
[0004]有鉴于此,本说明书实施例提供了一种客户信息管理方法
。
本说明书一个或者多个实施例同时涉及一种客户信息管理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷
。
[0005]根据本说明书实施例的第一方面,提供了一种客户信息管理方法,包括:获取初始客户信息集合,其中,所述初始客户信息集合包含至少一个客户对应的客户属性信息,所述客户属性信息包括名称信息
、
地址信息和区域信息;在所述名称信息
、
所述地址信息和所述区域信息中确定类别信息,并根据所述类别信息对各客户属性信息进行聚类
【技术保护点】
【技术特征摘要】
1.
一种客户信息管理方法,其特征在于,包括:获取初始客户信息集合,其中,所述初始客户信息集合包含至少一个客户对应的客户属性信息,所述客户属性信息包括名称信息
、
地址信息和区域信息;在所述名称信息
、
所述地址信息和所述区域信息中确定类别信息,并根据所述类别信息对各客户属性信息进行聚类,确定至少一个中间客户信息集合;根据目标中间客户信息集合中第一客户和第二客户的名称信息和地址信息,计算所述第一客户和所述第二客户的客户相似度;在所述客户相似度大于预设相似度阈值的情况下,为所述第一客户和所述第二客户生成目标客户信息标识
。2.
如权利要求1所述的方法,其特征在于,为所述第一客户和所述第二客户生成目标客户信息标识,包括:判断所述第一客户或所述第二客户是否标记有目标客户信息标识;若否,则基于客户信息标识生成规则为所述第一客户和所述第二客户生成目标客户信息标识;若是,为未标记所述目标客户信息标识的客户标记所述目标客户信息标识
。3.
如权利要求1所述的方法,其特征在于,根据目标中间客户信息集合中第一客户和第二客户的名称信息和地址信息,计算所述第一客户和所述第二客户的客户相似度,包括:获取所述第一客户对应的第一名称信息和第一地址信息,获取所述第二客户对应的第二名称信息和第二地址信息;基于预设名称相似度计算规则计算所述第一名称信息和所述第二名称信息之间的名称相似度;基于预设地址相似度计算规则计算所述第一地址信息和所述第二地址信息之间的地址相似度;根据所述名称相似度和所述地址相似度确定客户相似度
。4.
如权利要求3所述的方法,其特征在于,基于预设地址相似度计算规则计算所述第一地址信息和所述第二地址信息之间的地址相似度,包括:判断所述第一地址信息与所述第二地址信息是否相同;若是,则确定所述地址相似度为1;若否,则根据所述第一地址信息和所述第二地址信息计算所述地址相似度
。5.
如权利要求4所述的方法,其特征在于,根据所述第一地址信息和所述第二地址信息计算所述地址相似度,包括:获取地址判断模型,其中,所述地址判断模型包括地址判断层和地址相似度计算层;将所述第一地址信息和所述第二地址信息输入至所述地址判断层,获得所述地址判断层输出的地址判断结果置信度组,其中,所述地址判断结果置信度组包括至少两种地址判断结果和各地址判断结果置信度;将各地址判断结果和各地址判断结果置信度输入至所述地址相似度计算层,获得所述地址相似度计算层输出的所述地址相似度
。6.
如权利要求5所述的方法,其特征在于,所述地址判断模型通过下述步骤训练获得:获取样本地址和样本地址对应的样本地址相似度;
将所述样本地址输入至所述地址判断层,获得所述地址判断层输出的样本地址判断结果置信度组;将所述样本地址判断结果置信度组输入至所述地址相似度计算层,获得所述地址相似度计算层输出的预测样本地址相似度;根据所述预测样本地址相似度和所述样本地址相似度计算损失值,根据所述损失值调整所述地址相似度计算层的参数;继续训练所述地址判断模型,直至达到模型训练停止条件
。7.
如权利要求3所述的方法,其特征在于,基于预设名称相似度计算规则计算所述第一名称信息和所述第二名称信息之间的名称相似度,包括:判断所述第一名称信息与所述第二名称信息是否相同;若是,则确定所述名称相似度为1;若否,则根据所述第一名称信息和所述第二名称信息计算所述名称相似度
。8.
如权利要求7所述的方法,其特征在于,根据所述第一名称信息和所述第二名称信息计算所述名称相似度,包括:基于预设文本处理规则处理所述第一名称信息和所述第二名称信息生成第一名称比对信息和第二名称比对信息;判断所述第一名称比对信息和所述第二名称比对信息是否相同;若是,则确定所述名称...
【专利技术属性】
技术研发人员:王晨伟,方远,贾玉龙,
申请(专利权)人:赞塔杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。