用于医药电商平台的用户识别方法及系统技术方案

技术编号:37175322 阅读:15 留言:0更新日期:2023-04-20 22:44
本发明专利技术提供了一种用于医药电商平台的用户识别方法及系统,包括:步骤S1:获取两个待比较的个人信息集;步骤S2:比较两个信息集里面的手机号码,如果完全一样就判断为同一客户,如果不一样,则进入步骤S3;步骤S3:利用编辑距离判断两个信息集里面姓名的相似性,当编辑距离值超过阈值则判断为不同客户,否则进入步骤S4;步骤S4:比较两个信息集里面的收货地址的相似性,如果相似则判断为同一客户,否则判断为不同客户。本发明专利技术在保证较高准确率的基础上,有利于为医药电商平台减少人力成本,提高了平台的智能化管理水平。了平台的智能化管理水平。了平台的智能化管理水平。

【技术实现步骤摘要】
用于医药电商平台的用户识别方法及系统


[0001]本专利技术涉及计算机应用的
,具体地,涉及用于医药电商平台的用户识别方法及系统,尤其涉及一种用于医药电商平台的小b端用户识别方法。

技术介绍

[0002]在竞争日益激烈的医药行业,如何通过客户分层,实现精准化运营是一个十分重要的问题。毕竟对企业来说,集中有效资源去为更有价值的客户服务才可能实现利益的最大化。在这方面,医药电商平台具有独特的优势,借助强大的互联网技术,医药电商平台积累了大量的客户的数据,这些数据为研究客户分层提供了强有力的基础。对于医药电商平台来说,小b端客户是企业对外业务中的中坚力量,如何服务好这批客户对企业未来业务发展有着不小的影响。
[0003]客户的订单信息是识别小b端客户重要数据来源。通常来讲,订单信息主要有两部分组成,一个是客户的购买信息,其记录了客户购买药品的所有信息;一个是客户的个人信息,包括手机号码、收货地址以及收货人姓名等。这其中客户的个人信息是区分不同的客户订单以及收集同一客户订单信息的重要信息源。通过客户的个人信息比对,在一堆订单信息中统计出同一客户的订单量,以便确定是否是小b端客户。在确认这些订单信息的时候,通常业内的做法是人工核对,不过该方式有个很大的缺点就是审核工作量大。比如100条交易信息,如采用两两比对的方式,就需要上万次比对,随着数据量的增多,工作量将呈指数级增长,所以人工审核的方式在数据量较大的时候显然是不现实的。
[0004]与本方法接近的技术例如CN113743080A的专利技术公开了一种分层级地址文本相似度比对方法、装置及介质,属于信息比对
,方法包括:接收待比对的至少两个地址文本信息,对所述接收的待比对的至少两个地址文本信息进行文本信息分层处理,根据文本信息分层处理结果对所述待比对的至少两个地址文本信息做比对。本专利技术能够解决人工比对数据库中的地址文本信息的工作量大,和针对若采用地理位置坐标转换方法比对时,需要引入第三方地图服务而产生的不确定性,以及不方便包含隐私信息,同时不适合离线地址文本信息比对的问题,提高了地址文本信息比对效率的同时也增加了比对的精确度和稳定性。
[0005]本专利技术在地址文本相似度分析那里与该专利技术具有相似的地方,即都是基于分层比较的思路,不同的地方在对于详细地址相似度计算的处理上。该专利技术通过预设不同的m种规则进行相似度模糊匹配,最终相似度结果是这m个相似度求和与详细地址最小编辑距离的加权和。
[0006]因此,需要提出一种新的技术方案以改善上述技术问题。

技术实现思路

[0007]针对现有技术中的缺陷,本专利技术的目的是提供一种用于医药电商平台的用户识别方法及系统。
[0008]根据本专利技术提供的一种用于医药电商平台的用户识别方法,所述方法包括如下步骤:
[0009]步骤S1:获取两个待比较的个人信息集;
[0010]步骤S2:比较两个信息集里面的手机号码,如果完全一样就判断为同一客户,如果不一样,则进入步骤S3;
[0011]步骤S3:利用编辑距离判断两个信息集里面姓名的相似性,当编辑距离值超过阈值则判断为不同客户,否则进入步骤S4;
[0012]步骤S4:比较两个信息集里面的收货地址的相似性,如果相似则判断为同一客户,否则判断为不同客户。
[0013]优选地,所述步骤S1中的个人信息集包括手机号码、收货地址以及收货人信息。
[0014]优选地,所述步骤S3中的编辑距离阈值根据情况人工确定。
[0015]优选地,所述步骤S4包括如下步骤:
[0016]步骤S4.1:对地址进行清洗;
[0017]步骤S4.2:将中文地址按照地址要素进行拆分,最终拆分的结果包括宽范围地址和局部详细地址;
[0018]步骤S4.3:先比较两地址文本中宽范围地址的信息,如果宽范围地址中存在某地址要素不相同的情况,则判断为不同客户,否则进入下一流程判断;
[0019]步骤S4.4:比较局部详细地址,通过一系列正则表达式提取出地址中可能存在的道路、门牌号、楼牌号信息,然后比较两地址的识别结果,如若存在某一地址要素识别结果不相同,则判断为不同客户,否则利用编辑距离判断两局部详细地址的相似性,编辑距离的阈值根据情况人工确定,若计算的编辑距离值超过阈值则判断为同一客户,否则为不同客户。
[0020]优选地,所述步骤S4.1中对地址进行清洗包括对脏数据的清洗、将中文数字转化为阿拉伯数字以及小写字母转化为大写字母。
[0021]本专利技术还提供一种用于医药电商平台的用户识别系统,所述系统包括如下模块:
[0022]模块M1:获取两个待比较的个人信息集;
[0023]模块M2:比较两个信息集里面的手机号码,如果完全一样就判断为同一客户,如果不一样,则进入模块M3;
[0024]模块M3:利用编辑距离判断两个信息集里面姓名的相似性,当编辑距离值超过阈值则判断为不同客户,否则进入模块M4;
[0025]模块M4:比较两个信息集里面的收货地址的相似性,如果相似则判断为同一客户,否则判断为不同客户。
[0026]优选地,所述模块M1中的个人信息集包括手机号码、收货地址以及收货人信息。
[0027]优选地,所述模块M3中的编辑距离阈值根据情况人工确定。
[0028]优选地,所述模块M4包括如下模块:
[0029]模块M4.1:对地址进行清洗;
[0030]模块M4.2:将中文地址按照地址要素进行拆分,最终拆分的结果包括宽范围地址和局部详细地址;
[0031]模块M4.3:先比较两地址文本中宽范围地址的信息,如果宽范围地址中存在某地
址要素不相同的情况,则判断为不同客户,否则进入下一流程判断;
[0032]模块M4.4:比较局部详细地址,通过一系列正则表达式提取出地址中可能存在的道路、门牌号、楼牌号信息,然后比较两地址的识别结果,如若存在某一地址要素识别结果不相同,则判断为不同客户,否则利用编辑距离判断两局部详细地址的相似性,编辑距离的阈值根据情况人工确定,若计算的编辑距离值超过阈值则判断为同一客户,否则为不同客户。
[0033]优选地,所述模块M4.1中对地址进行清洗包括对脏数据的清洗、将中文数字转化为阿拉伯数字以及小写字母转化为大写字母。
[0034]与现有技术相比,本专利技术具有如下的有益效果:
[0035]1、本专利技术通过综合利用客户的多维度信息,从而达到了对小b端用户高效精准的目的;
[0036]2、从以上方案可以看出,本专利技术所涉及技术简单,过程清晰,从而易于实现,且实现成本低;
[0037]3、本专利技术所提出的小b端用户自动识别算法,可以有效减少平台运营成本、提高其智能化管理水平;
[0038]4、本专利技术中,在最为关键的地址文本相似性比较的地方,采用了分层比较的思路,该思路较传统的编辑距离计算更加准确,对整体算法识别准确率的提升有积极作用。
附图说明
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于医药电商平台的用户识别方法,其特征在于,所述方法包括如下步骤:步骤S1:获取两个待比较的个人信息集;步骤S2:比较两个信息集里面的手机号码,如果完全一样就判断为同一客户,如果不一样,则进入步骤S3;步骤S3:利用编辑距离判断两个信息集里面姓名的相似性,当编辑距离值超过阈值则判断为不同客户,否则进入步骤S4;步骤S4:比较两个信息集里面的收货地址的相似性,如果相似则判断为同一客户,否则判断为不同客户。2.根据权利要求1所述的用于医药电商平台的用户识别方法,其特征在于,所述步骤S1中的个人信息集包括手机号码、收货地址以及收货人信息。3.根据权利要求1所述的用于医药电商平台的用户识别方法,其特征在于,所述步骤S3中的编辑距离阈值根据情况人工确定。4.根据权利要求1所述的用于医药电商平台的用户识别方法,其特征在于,所述步骤S4包括如下步骤:步骤S4.1:对地址进行清洗;步骤S4.2:将中文地址按照地址要素进行拆分,最终拆分的结果包括宽范围地址和局部详细地址;步骤S4.3:先比较两地址文本中宽范围地址的信息,如果宽范围地址中存在某地址要素不相同的情况,则判断为不同客户,否则进入下一流程判断;步骤S4.4:比较局部详细地址,通过一系列正则表达式提取出地址中可能存在的道路、门牌号、楼牌号信息,然后比较两地址的识别结果,如若存在某一地址要素识别结果不相同,则判断为不同客户,否则利用编辑距离判断两局部详细地址的相似性,编辑距离的阈值根据情况人工确定,若计算的编辑距离值超过阈值则判断为同一客户,否则为不同客户。5.根据权利要求1所述的用于医药电商平台的用户识别方法,其特征在于,所述步骤S4.1中对地址进行清洗包括对脏数据的清洗、将中文数字转化为阿拉伯数字以及小写字母转化为大写字母。6.一种用于医...

【专利技术属性】
技术研发人员:杨旭
申请(专利权)人:植恩生物技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1