用户聚类及特征学习方法、设备、计算机可读介质技术

技术编号:23933999 阅读:42 留言:0更新日期:2020-04-25 02:28
本申请提供了一种用户聚类及特征学习方案,结合了聚类算法和深度学习网络中的编码解码模型,可以先基于用户的交易行为数据确定用户的交易行为序列,而后基于深度学习网络的编码器,将各个用户的交易行为序列进行编码,生成深度特征;在根据所述深度特征对用户进行聚类获取聚类结果的同时,基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列;而后根据聚类结果和解码结果确定学习目标,并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,由此在完成聚类的同时,能够优化深度学习网络,以获得更好的、用于实现聚类的深度特征。

User clustering and feature learning methods, devices, computer-readable media

【技术实现步骤摘要】
用户聚类及特征学习方法、设备、计算机可读介质
本申请涉及信息
,尤其涉及一种用户聚类及特征学习方法、设备、计算机可读介质。
技术介绍
随着互联网技术以及电子商务的发展,涌现了大量的电商平台,给消费者带来了便利。而电商平台中接入的用户数量也越来越多,虽然其中正常用户的数量一般占绝大多数,但其中也会隐藏一些实施非法行为的用户,此类用户会给电商平台以及使用电商平台的消费者带来风险。为了能够识别出此类用户,目前常用的方式是使用聚类算法对所有用户进行划分,根据聚类结果了解风险客户的分布。而目前常用的聚类算法,如k均值聚类算法(K_means)、基于密度的噪声应用空间聚类算法(DBscan)等,虽然在一定数据集上有较好的表现,但是使用的聚类特征大都依赖人工的经验形成的,在数据集发生变化后其性能会显著降低,需要再次通过人工的方式重新确定聚类特征。申请内容本申请的一个目的是提供一种用户聚类及特征学习的方案,用以解决现有方案中无法在聚类的同时快速获得用于聚类的特征的问题。本申请实施例提供了一种用户聚类及特征学习方法,该方法包括:获取用户的交易行为数据,并根据所述交易行为数据确定各个用户的交易行为序列,所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据;基于深度学习网络的编码器,将各个用户的交易行为序列进行编码,生成深度特征;基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列,并根据所述深度特征对用户进行聚类,获取聚类结果;>根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标,所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定,所述聚类的目标函数根据所述聚类结果确定;根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,以使所述学习目标符合预设条件。本申请实施例还提供了一种用户聚类及特征学习设备,该设备包括:数据获取模块,用于获取用户的交易行为数据,并根据所述交易行为数据确定各个用户的交易行为序列,所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据;深度学习模块,用于基于深度学习网络的编码器,将各个用户的交易行为序列进行编码,生成深度特征;以及基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列;聚类模块,用于根据所述深度特征对用户进行聚类,获取聚类结果;迭代处理模块,用于根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标,所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定,所述聚类的目标函数根据所述聚类结果确定;以及根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,以使所述学习目标符合预设条件。此外,本申请的一些实施例还提供了一种计算设备,该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发所述用户聚类及特征学习方法。本申请的另一些实施例还提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机可读指令可被处理器执行以实现所述用户聚类及特征学习方法。本申请实施例提供的用户聚类及特征学习方案结合了聚类算法和深度学习网络中的编码解码模型,可以先基于用户的交易行为数据确定用户的交易行为序列,而后基于深度学习网络的编码器,将各个用户的交易行为序列进行编码,生成深度特征;在根据所述深度特征对用户进行聚类获取聚类结果的同时,基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列;而后根据聚类结果和解码结果确定学习目标,并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,由此在完成聚类的同时,能够优化深度学习网络以获得更好的、用于实现聚类的深度特征。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本申请实施例提供的一种用户聚类及特征学习方法的处理流程图;图2为本申请的实施例中进行解码和编码过程的处理原理图;图3为本申请实施例提供的一种用户聚类及特征学习设备的结构示意图;图4为本申请实施例提供的一种用于实现用户聚类及特征学习的计算设备的结构示意图;附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本申请作进一步详细描述。在本申请一个典型的配置中,终端、服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的装置或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。本申请实施例提供了一种用户聚类及特征学习方法,该方法结合了聚类算法和深度学习网络中的编码解码模型,能够根据聚类结果和解码结果确定学习目标,并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,由此在完成聚类的同时,能够优化深度学习网络以获得更好的、用于实现聚类的深度特征,从而解决现有方案中无法在聚类的同时快速获得用于聚类的特征的问题。在实际场景中,该方法的执行主体可以是用户设备、网络设备或者用户设备与网络设备通过网络相集成所构成的设备,此外也可以是运行于上述设备中的程序。所述用户设备包括但不限于计算机、手机、平板电脑等各类终端设备;所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此,云由基于云计算(CloudComputing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟计算机。图1示出了本申请实施例提供的一种用户聚类及特征学习方法,该方法包括以下处理步骤:步骤S101,获取用户的交易行为数据,并根据所述交易行为数据确定各个用户的交易行为序列。其中,所述用户的交易行为数据可以是任意能够反映出用户在交易过程中所实施的相关行为的数据。在本申请的一些实施例中,所述交易行为数据可以是用户在多个时间窗口所对应的多项交易行为信本文档来自技高网...

【技术保护点】
1.一种用户聚类及特征学习方法,其中,该方法包括:/n获取用户的交易行为数据,并根据所述交易行为数据确定各个用户的交易行为序列,所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据;/n基于深度学习网络的编码器,将各个用户的交易行为序列进行编码,生成深度特征;/n基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列,并根据所述深度特征对用户进行聚类,获取聚类结果;/n根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标,所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定,所述聚类的目标函数根据所述聚类结果确定;/n根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,以使所述学习目标符合预设条件。/n

【技术特征摘要】
1.一种用户聚类及特征学习方法,其中,该方法包括:
获取用户的交易行为数据,并根据所述交易行为数据确定各个用户的交易行为序列,所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据;
基于深度学习网络的编码器,将各个用户的交易行为序列进行编码,生成深度特征;
基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列,并根据所述深度特征对用户进行聚类,获取聚类结果;
根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标,所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定,所述聚类的目标函数根据所述聚类结果确定;
根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,以使所述学习目标符合预设条件。


2.根据权利要求1所述的方法,其中,基于深度学习网络的编码器,将每个用户的交易行为序列进行编码,生成深度特征,包括:
对用户的交易行为序列进行位置编码,确定序列元素在交易行为序列中的相对位置信息;
将携带有相对位置信息的交易行为序列,输入采用多头注意力机制的深度学习网络的编码器,获得深度特征。


3.根据权利要求2所述的方法,其中,基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列,包括:
将深度特征输入采用多头注意力机制的深度学习网络的解码器,获得还原的交易行为序列中的首个序列元素;
将深度特征输入和前一次解码获得的序列元素,输入采用多头注意力机制的深度学习网络的解码器,还原的交易行为序列中的后续序列元素。


4.根据权利要求2所述的方法,其中,对用户的交易行为序列进行位置编码,确定序列元素在交易行为序列中的相对位置信息,包括:
根据序列元素在交易行为序列中的排序位置和元素序列的维度,确定序列元素在交易行为序列中的相对位置信息。


5.根据权利要求1所述的方法,其中,所述交易行为数据包括在多个时间窗口所对应的多项交易行为信息。


6.根据权利要求1所述的方法,其中,所述深度学习网络的损失函数为还原的交易行为序列与原始的交易行为序列的平方差。


7.根据权利要求1所述的方法,其中,所述聚类的目标函数为聚类结果中各个类别对应的深度特征的标准差之和。


8.根据权利要求1所述的方法,其中,根据所述深度特征对用户进行聚类,获取聚类结果,包括:
采用基于层次密度的噪声应用空间聚类算法,根据所述深度特征对用户进行聚类,获取聚类结果。


9.一种用户聚类及特征学习设备,其中,该设备包括:
数据获取模块,用于获取用...

【专利技术属性】
技术研发人员:李怀松潘健民
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1