用户识别方法和装置、计算机可读存储介质、电子设备制造方法及图纸

技术编号:26600504 阅读:23 留言:0更新日期:2020-12-04 21:23
本公开实施例公开了一种用户识别方法和装置、计算机可读存储介质、电子设备,其中,方法包括:获取待识别用户的至少一种行为数据;根据所述至少一种行为数据确定所述待识别用户的行为特征向量;利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的预测概率;其中,所述判别器基于结合生成器的对抗训练获得;本实施例获得待识别用户的至少一种行为数据,提高了行为特征向量对待识别用户的特征表达的准确性,并且,利用训练好的判别器确定待识别用户的预测概率,不需要反复训练模型分类器,降低了复杂度,提高了识别效率。

【技术实现步骤摘要】
用户识别方法和装置、计算机可读存储介质、电子设备
本公开涉及用户识别
,尤其是一种用户识别方法和装置、计算机可读存储介质、电子设备。
技术介绍
人力成本是企业经营成本的重要组成部分,随着人力成本的不断提升,如何提升人效,成为了各大企业面临的一大难题,如何对用户进行识别,将异常用户筛选出来,从而将更多精力集中在正常用户,提高人效是现有技术需要解决的问题。例如,在房产服务领域,经纪人角色的时间分配上,在传统的房产中介场景中,获客这一环节会占据绝大比例。在获客过程中,因为贝壳是强大的线上平台,线上客源的重要性不言而喻,但客源的质量参差不齐,部分异常客户,如推销、微商、同业经纪人等,通过建立大量链接,占用经纪人的大量资源。经纪人在前期无法识别客户是否异常,导致浪费大量人力成本。
技术实现思路
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种用户识别方法和装置、计算机可读存储介质、电子设备。根据本公开实施例的一个方面,提供了一种用户识别方法,包括:获取设定时间段内待识别用户的至少一种行为数据;根据所述至少一种行为数据确定所述待识别用户的行为特征向量;利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的行为指标的预测概率;其中,所述判别器基于结合生成器的对抗训练获得。可选地,所述至少一种行为数据包括以下至少之一:线上行为数据、线下行为数据、交互行为数据。可选地,所述利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的行为指标的预测概率之前,还包括:基于所述生成器和所述判别器构成对抗网络,对所述对抗网络进行训练。可选地,所述对所述对抗网络进行训练,包括:获取第一正样本集和真负样本集;其中,所述第一正样本集中包括至少一个正样本,所述真负样本集中包括至少一个真负样本,每个所述真负样本的行为数据与所述正样本的行为数据之间的差异小于设定值;将所述第一正样本集输入所述判别器,得到每个所述正样本对应的行为指标的第一预估异常概率;将所述真负样本集中的每个真负样本输入到所述生成器,得到包括的至少一个第二样本的第二正样本集,并基于所述判别器确定每个所述第二样本对应的行为指标的第二预估异常概率;基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失;基于所述损失对所述对抗网络进行训练,得到训练后的判别器。可选地,在基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失之前,还包括:基于用户生命价值网络确定所述第一正样本集和所述第二正样本集中每个样本对应的正常预估概率;所述基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失,包括:基于所述第一预估异常概率、所述第二预估异常概率和所述正常预估概率,确定所述对抗网络的损失。可选地,所述获取第一正样本集和真负样本集,包括:基于标注信息和/或至少一种预设规则获得至少一个正样本,构成所述第一正样本集;其中,所述预设规则包括至少一种行为数据符合设定条件;基于标注信息获得至少一个真负样本,构成所述真负样本集。可选地,所述基于至少一种预设规则获得至少一个正样本,包括:基于多个训练用户在所述设定时间段内的至少一种行为数据,确定所述多个训练用户中每个训练用户对应的训练特征;利用孤立森林算法对所述多个训练特征进行切分处理,得到每个所述训练特征对应的离散概率,基于所述离散概率确定每个所述训练特征对应的一维强特征;响应于所述训练特征和所述一维强特征符合所述设定条件,确定所述训练用户是正样本;响应于所述训练特征和所述一维强特征不符合所述设定条件,将所述训练样本作为待识别用户,得到待识别用户集。可选地,还包括:基于所述待识别用户对应的预测概率,确定所述待识别用户是否正常用户。可选地,所述基于所述待识别用户对应的行为指标的预测概率,确定所述待识别用户是否符合识别条件,包括:判断所述待识别用户对应的行为指标的预测概率是否小于分类器阈值;如果是,确定所述待识别用户符合识别条件,否则,确定所述待识别用户不符合识别条件。可选地,在判断所述待识别用户对应的预测概率是否小于分类器阈值之前,还包括:合并所述第一正样本集和所述第二正样本集,得到第三正样本集;将所述第三正样本集随机分割为第二预测集和第四正样本集;基于所述第四正样本集对分类器进行训练,得到训练后的分类器;基于所述训练后的分类器对所述第二预测集得到的多个分类概率值,确定所述分类器阈值。根据本公开实施例的另一方面,提供了一种用户识别装置,包括:行为数据获取模块,用于获取设定时间段内待识别用户的至少一种行为数据;特征确定模块,用于根据所述至少一种行为数据确定所述待识别用户的行为特征向量;概率预测模块,用于利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的行为指标的预测概率;其中,所述判别器基于结合生成器的对抗训练获得。可选地,所述至少一种行为数据包括以下至少之一:线上行为数据、线下行为数据、交互行为数据。可选地,所述装置,还包括:网络训练模块,用于基于所述生成器和所述判别器构成对抗网络,对所述对抗网络进行训练。可选地,所述网络训练模块,包括:样本获取单元,用于获取第一正样本集和真负样本集;其中,所述第一正样本集中包括至少一个正样本,所述真负样本集中包括至少一个真负样本,每个所述真负样本的行为数据与所述正样本的行为数据之间的差异小于设定值;第一预估单元,用于将所述第一正样本集输入所述判别器,得到每个所述正样本对应的行为指标的第一预估异常概率;第二预估单元,用于将所述真负样本集中的每个真负样本输入到所述生成器,得到包括的至少一个第二样本的第二正样本集,并基于所述判别器确定每个所述第二样本对应的行为指标的第二预估异常概率;损失确定单元,用于基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失;训练单元,用于基于所述损失对所述对抗网络进行训练,得到训练后的判别器。可选地,所述网络训练模块,还包括:第三预估单元,用于基于用户生命价值网络确定所述第一正样本集和所述第二正样本集中每个样本对应的正常预估概率;所述损失确定单元,具体用于基于所述第一预估异常概率、所述第二预估异常概率和所述正常预估概率,确定所述对抗网络的损失。可选地,所述样本获取单元,具体用于基于标注信息和/或至少一种预设规则获得至少一个正样本,构成所述第一正样本集;其中,所述预设规则包括至少一种行为数据符合设定条件;基于标注信息获得至少一个真负样本,构成所述真负样本集。可选地,所述样本获取单元在基于至少一种预设规则获得至少一个正样本时,用于基于多个训练用户在所述设定时间段内的至少一种行为数据,确定所述多个训练用户中每个训练用户对应的训练特本文档来自技高网...

【技术保护点】
1.一种用户识别方法,其特征在于,包括:/n获取设定时间段内待识别用户的至少一种行为数据;/n根据所述至少一种行为数据确定所述待识别用户的行为特征向量;/n利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的行为指标的预测概率;其中,所述判别器基于结合生成器的对抗训练获得。/n

【技术特征摘要】
1.一种用户识别方法,其特征在于,包括:
获取设定时间段内待识别用户的至少一种行为数据;
根据所述至少一种行为数据确定所述待识别用户的行为特征向量;
利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的行为指标的预测概率;其中,所述判别器基于结合生成器的对抗训练获得。


2.根据权利要求1所述的方法,其特征在于,所述利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的行为指标的预测概率之前,还包括:
基于所述生成器和所述判别器构成对抗网络,对所述对抗网络进行训练。


3.根据权利要求1或2所述的方法,其特征在于,所述对所述对抗网络进行训练,包括:
获取第一正样本集和真负样本集;其中,所述第一正样本集中包括至少一个正样本,所述真负样本集中包括至少一个真负样本,每个所述真负样本的行为数据与所述正样本的行为数据之间的差异小于设定值;
将所述第一正样本集输入所述判别器,得到每个所述正样本对应的行为指标的第一预估异常概率;
将所述真负样本集中的每个真负样本输入到所述生成器,得到包括的至少一个第二样本的第二正样本集,并基于所述判别器确定每个所述第二样本对应的行为指标的第二预估异常概率;
基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失;
基于所述损失对所述对抗网络进行训练,得到训练后的判别器。


4.根据权利要求3所述的方法,其特征在于,在基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失之前,还包括:
基于用户生命价值网络确定所述第一正样本集和所述第二正样本集中每个样本对应的正常预估概率;
所述基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失,包括:
基于所述第一预估异常概率、所述第二预估异常概率和所述正常预估概率,确定所述对抗网络的损失。


5.根据权利要求3或4所述的方法,其特征在于,所述获取第...

【专利技术属性】
技术研发人员:刘洋李嘉晨
申请(专利权)人:贝壳技术有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1