一种账户去重方法、装置及电子设备制造方法及图纸

技术编号:33861007 阅读:29 留言:0更新日期:2022-06-18 10:50
本发明专利技术提供了一种账户去重的方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:计算两个账户的特征相似度,获得所有账户的全体特征相似度向量;根据全体特征相似度向量通过逻辑回归模型获得两个账户的相似度得分;如果相似度得分不小于最优相似度得分阈值,判定该两个账户为同一用户,迭代得到所有同一用户的二元组数据;根据账户ID和二元组数据获得相同用户组。本发明专利技术实施例提供的账户去重的方法、装置、电子设备及计算机可读存储介质,计算得出两个用户的相似度得分,在相似度得分超过最优相似度阈值的情况下,判定该两个账户为同一用户在使用,完成了同一用户拥有不同账户的去重工作,提高了用户去重的准确率。提高了用户去重的准确率。提高了用户去重的准确率。

【技术实现步骤摘要】
一种账户去重方法、装置及电子设备


[0001]本专利技术涉及互联网电商
,具体而言,涉及一种账户去重方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]电商广告投放系统(电商广告SaaS系统)为一个B2B系统,用于帮助跨境电商用户在海外广告媒体平台(如Facebook、Google、Tiktok等)推广电商商品。
[0003]电商广告投放系统存在许多注册账户,并且对新注册账户有一些优惠政策,例如,如果新账户开通广告账户能够拿到更高的媒体广告返点。因此,一些用户为了拿到更多的优惠政策,伪造多个公司主体的身份,在电商广告投放系统注册多个广告账户。这些广告账户的工商营业执照都不相同,联系人/联系电话/邮箱等也都不相同,但是用户的网站访问行为/广告账户的特征/推广商品的特征具有一定的相似性。
[0004]跨境电商用户为了规避平台风险,拿到更多的新用户优惠,会通过多种途径注册多个电商广告投放系统的广告账户,事实上该多个广告账户仅对应一个真实的用户。如果直接统计系统中的用户数,得到的统计数据会有水分。为了统计出真实的用户本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种账户去重方法,其特征在于,包括:计算两个账户的特征相似度,获得所有账户的全体特征相似度向量;根据所述全体特征相似度向量通过逻辑回归模型获得两个账户的相似度得分;如果所述相似度得分不小于最优相似度得分阈值,判定该两个账户为同一用户,迭代得到所有同一用户的二元组数据;根据账户ID和所述二元组数据获得相同用户组。2.根据权利要求1所述的方法,其特征在于,所述根据账户ID和所述二元组数据获得相同用户组的步骤包括:以所述账户ID为顶点,以所述二元组数据为边,构建无向图;根据所述无向图计算得出所述无向图的连通分支,获得相同用户组;其中,每个所述连通分支代表一个相同用户组。3.根据权利要求1或2所述的方法,其特征在于,所述计算两个账户的特征相似度,获得所有账户的全体特征相似度向量的步骤包括:分别计算两个账户的各种特征相似度得到该两个账户的特征相似度集合;遍历所有两个账户的所述特征相似度集合,获得所有账户的全体特征相似度向量;所述特征相似度集合包括:登录IP相似度、广告账户名称相似度、开户域名相似度、广告推广地址页面文本相似度和广告推广地址主页截图相似度。4.根据权利要求1所述的方法,其特征在于,所述如果相似度得分不小于最优相似度得分阈值的步骤具体包括:如果两个账户的相似度得分不小于相似度得分阈值,判定该两个账户为同一用户的标签数据;根据所有两个账户的标签数据,计算所述逻辑回归模型的模型准确率;选择所述模型准确率最高的相似度得分阈值作为最优相似度得分阈值。5.一种账户去重装置,其特征在于,包括:向量获得模块,用于计算两个账户的特征相似度,获得所有账户的全体特征相似度向量;得分获得模块,用于根据所述全体特征相似度向量通过逻辑回归模型获得两个账户的相似度得分;数据迭代模块,用于如果所述相似度得分不小于最...

【专利技术属性】
技术研发人员:张天生沈菁康单张聪陈文海陆璐熊家治
申请(专利权)人:飞书深诺数字科技上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1