一种提高用户鉴权准确性的方法与系统技术方案

技术编号:26976731 阅读:37 留言:0更新日期:2021-01-06 00:14
本发明专利技术公开一种提高用户鉴权准确性的方法与系统。所述方法包括:基于本地数据库和第三方数据库,构建变分自编码器;基于标签,将海量历史用户数据分为三类,分别为第一类用户数据、第二类用户数据和第三类用户数据;基于所述变分自编码器和第三类用户数据,对所述第三类用户数据进行样本增量操作;基于海量历史用户数据和样本增量操作得到的第三类用户数据,建立二分类模型;接收用户请求;基于所述二分类模型,对所述用户进行鉴权。本发明专利技术提出的方法能够充分利用已知信息,生成更多的负样本,而这些生成的负样本能够给模型带来更多的信息。同时变分自编码器VAE也充分利用了拒绝样本的信息,而且其编码器部分能够实现特征维度的降维,以提升模型的效果和稳定性。

【技术实现步骤摘要】
一种提高用户鉴权准确性的方法与系统
本专利技术属于大数据分析与数据挖掘领域,尤其涉及一种提高用户鉴权准确性的方法与系统。
技术介绍
移动互联网的快速发展催生了手机端业务的快速发展,用户只需要在手机APP上提交申请资料便可以极速享受相应应用的功能。而与此同时运营商服务器这边会有部署一套鉴权措施,以保证合法用户权益,防止不良用户给运营商带来损失。由于市场竞争激烈,服务器这边是否能够快速且精准地反馈结果就变得非常重要。通常来说,采用如下方式鉴权:接收手机端用户的申请数据,包括用户的性别、年龄、职业信息、教育背景、居住地区等信息,手机关联的信息,比如IP地址、手机APP数量、手机品牌等,并在用户的授权下查询用户的第三方数据,以获得用户特征的360度全景图。我们在业务有了一定积累之后,会基于过去的历史数据建立历史数据库,并基于这些历史数据来建立和优化鉴权模型,以更好的控制风险。而这种鉴权实际是一种二分类任务,即预测一个用户是否是不良用户。解决二分类问题通常使用监督学习算法,而在实际应用中,往往负样本数目极少,样本类别十分不均衡。这会导致二本文档来自技高网...

【技术保护点】
1.一种提高用户鉴权准确性的方法,其特征在于,包括以下步骤:/n基于本地数据库和第三方数据库,收集海量历史用户数据;/n基于所述海量历史用户数据,构建变分自编码器;/n基于标签,将海量历史用户数据分为三类,分别为第一类用户数据、第二类用户数据和第三类用户数据;/n基于所述变分自编码器和第三类用户数据,对所述第三类用户数据进行样本增量操作,所述第三类用户代表负样本标签用户,所述样本增量操作是指基于已有的第三类用户数据生成更多不同的第三类用户数据;/n基于海量历史用户数据和样本增量操作得到的第三类用户数据,建立二分类模型;/n接收用户请求;/n基于所述二分类模型,对所述用户进行鉴权。/n

【技术特征摘要】
1.一种提高用户鉴权准确性的方法,其特征在于,包括以下步骤:
基于本地数据库和第三方数据库,收集海量历史用户数据;
基于所述海量历史用户数据,构建变分自编码器;
基于标签,将海量历史用户数据分为三类,分别为第一类用户数据、第二类用户数据和第三类用户数据;
基于所述变分自编码器和第三类用户数据,对所述第三类用户数据进行样本增量操作,所述第三类用户代表负样本标签用户,所述样本增量操作是指基于已有的第三类用户数据生成更多不同的第三类用户数据;
基于海量历史用户数据和样本增量操作得到的第三类用户数据,建立二分类模型;
接收用户请求;
基于所述二分类模型,对所述用户进行鉴权。


2.如权利要求1所述方法,其特征在于,其中所述基于所述海量历史用户数据,构建变分自编码器包括:
基于所述海量历史用户数据,建立历史用户数据集;
基于历史用户数据集,构建变分自编码器。


3.如权利要求1所述方法,其特征在于,其中所述第一类用户数据为无标签用户数据,所述第二类用户数据为标签为1的用户数据,所述第三类用户数据为标签为0的用户数据。


4.如权利要求1所述方法,其特征在于,其中基于所述变分自编码器和第三类用户数据,对所述第三类用户数据进行样本增量操作包括:
提取第三类用户数据的特征,输入所述变分自编码器的编码器,输出正态分布的均值和方差;
基于上述均值和方差的正态分布生成多个随机噪声样本;
将所述多个随机噪声样本输入所述变分自编码器的解码器,生成新的样本数据,所述新的样本数据为与上述第三类用户数据不同的第三类用户数据。


5.如权利要求...

【专利技术属性】
技术研发人员:邵俊
申请(专利权)人:索信达北京数据技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1