一种用于用户分析的系统和方法技术方案

技术编号:26772313 阅读:45 留言:0更新日期:2020-12-18 23:55
提供了一种用于用户挖掘的方法。该方法可以包括获取至少两个正样本的至少两个第一特征向量和至少两个负样本的至少两个第二特征向量,并且基于所述至少两个第一特征向量和第二特征向量以及扩充第二特征向量生成至少两个扩充第一特征向量。每个第一特征向量可以包括描述相应的正样本的至少两个特征的第一特征信息。每个第二特征向量可以包括描述相应的正样本的至少两个特征的第二特征信息。该方法还可以包括通过使用至少两个扩充第一特征向量和扩充第二特征向量生成训练后的二元模型,基于训练后的二元模型确定至少两个特征中的与至少两个正样本相关的一个或以上核心特征。

【技术实现步骤摘要】
【国外来华专利技术】一种用于用户分析的系统和方法
本申请一般涉及用户分析,更具体地,涉及用于挖掘用户的特征并生成用户的虚拟简档的系统和方法。
技术介绍
在互联网技术中,用户特征挖掘通常是服务系统开发和运行的关键。通过用户特征挖掘,可以识别和量化各种用户类型的特征,从而为用户分类、个性化服务和营销提供基础。仅作为示例,可以确定服务系统中至少两个活动用户的核心特征,并且这样的核心特征可以用于识别具有与活动用户类似的特征的潜在活动用户。因此,可以对所识别的潜在活动用户采用活动营销策略。因此,期望提供用于挖掘用户特征的有效系统和方法。
技术实现思路
根据本申请的一个方面,提供了一个系统。该系统可以包括至少一个存储介质和至少一个与该至少一个存储介质通信的处理器。存储介质可以包括用于用户挖掘的一组指令。当执行该组指令时,可以指示所述至少一个处理器获取至少两个正样本的至少两个第一特征向量和至少两个负样本的至少两个第二特征向量。每个第一特征向量可以包括描述至少两个正样本中相应的正样本的至少两个特征的第一特征信息。每个第二特征向量可以包括描述至少两个负样本中相应的正样本的至少两个特征的第二特征信息。所述至少一个处理器还可以用于基于至少两个第一特征向量和至少两个第二特征向量来生成至少两个扩充第一特征向量和至少两个扩充第二特征向量。至少一个处理器还可以用于在至少两个特征中,基于训练后的二元模型确定与至少两个正样本相关的一个或以上核心特征,训练后的二元模型通过使用至少两个扩充第一特征向量和至少两个扩充第二特征向量生成。在一些实施例中,为了获取至少两个正样本的至少两个第一特征向量,所述至少一个处理器可以用于获取与一个或以上目标特征相关的一个或以上选择标准,并获取至少两个样本的一个或以上目标特征的第三特征信息。所述至少一个处理器可以进一步用于基于所述第三特征信息和所述一个或以上选择标准选择来自所述至少两个样本中所述至少两个正样本。在一些实施例中,为了获取至少两个负样本的至少两个第二特征向量,可以指示至少一个处理器在至少两个样本中选择至少两个初始负样本。所述至少一个处理器还可以用于获取至少两个初始负样本的一个或以上目标特征的第四特征信息。所述至少一个处理器还可以用于基于所述第四特征信息和所述一个或以上选择标准在至少两个初始负样本中选择至少两个负样本。在一些实施例中,为了确定至少两个扩充第一特征向量和至少两个扩充第二特征向量,所述至少一个处理器可以用于确定第一特征向量中的每一对第一特征向量之间的第一向量差,并将第一特征向量中的每一对第一特征向量之间的第一向量差指定为扩充第一特征向量之一。所述至少一个处理器还可以进一步用于确定第一特征向量和第二特征向量中的每一对之间的第二向量差,并将第一特征向量和第二特征向量中的每一对之间的第二向量差为指定扩充第二特征向量之一。在一些实施例中,为了确定至少两个充满第一特征向量和至少两个第二特征向量,至少一个处理器可以用于标准化至少两个第一特征向量和至少两个第二特征向量。该至少一个处理器可以基于至少两个标准化的第一特征向量和至少两个标准化的第二特征向量进一步用于确定至少两个扩充第一特征向量和至少两个扩充第二特征向量。在一些实施例中,为了确定与至少两个正样本相关的一个或以上核心特征,可以指示至少一个处理器基于训练后的二元模型确定至少两个特征的至少两个权重。该至少一个处理器还可以用于根据相应的权重对至少两个特征进行排名。至少一个处理器还可以用于基于排序结果确定特征中的一个或以上核心特征。在一些实施例中,至少一个处理器可以进一步用于基于一个或以上核心特征和至少两个第一特征向量来生成至少两个正样本的虚拟简档。一个或以上核心特征中的每一个可以在虚拟简档中具有相应的第一参考值。在一些实施例中,为了生成至少两个正样本的虚拟简档,可以指示所述至少一个处理器基于所述至少两个第一特征向量来确定所述一个或以上核心特征中的每一个的平均特征值。可以指示至少一个处理器将平均特征值指定为虚拟简档的相应核心特征的第一参考值。在一些实施例中,为了生成至少两个正样本的虚拟简档,可以指示所述至少一个处理器基于所述至少两个第二特征向量来确定所述一个或以上核心特征中的每一个的第二参考值。所述至少一个处理器还可以用于基于所述一个或以上核心特征中的每一个的第二参考值过滤所述至少两个第一特征向量。所述至少一个处理器还可以被引导使用所述经过滤的第一特征向量来生成所述至少两个正样本的虚拟简档。在一些实施例中,所述至少一个处理器可以进一步用于获取至少两个样本的一个或以上核心特征的第五特征信息,并基于正样本和第五特征信息的虚拟简档在至少两个样本中识别至少两个目标样本。根据本申请的一个方面,提供了一个方法。该方法可以在具有至少一个处理器,至少一个计算机可读存储介质和连接到网络的通信平台的计算设备上实现。该方法可以包括获取至少两个正样本的至少两个第一特征向量和至少两个负样本的至少两个第二特征向量。每个第一特征向量可以包括描述至少两个正样本中相应的正样本的至少两个特征的第一特征信息。每个第二特征向量可以包括描述至少两个负样本中相应的正样本的至少两个特征的第二特征信息。该方法还可以包括基于至少两个第一特征向量和至少两个第二特征向量生成至少两个扩充第一特征向量和至少两个扩充第二特征向量。该方法还可以包括基于训练后的二元模型确定至少两个特征中的与至少两个正样本相关的一个或以上核心特征,训练后的二元模型通过使用至少两个扩充第一特征向量和至少两个扩充第二特征向量生成。在本申请的另一方面,提供了一种体现计算机程序产品的非暂时性计算机可读介质。包含指令的计算机程序产品可以被配置用于使计算设备获取至少两个正样本和至少两个负样本的至少两个第二特征向量。每个第一特征向量可以包括描述至少两个正样本中相应的正样本的至少两个特征的第一特征信息。每个第二特征向量可以包括描述至少两个负样本中相应的正样本的至少两个特征的第二特征信息。包含指令的计算机程序产品可以进一步被配置为使计算设备基于至少两个第一特征向量和至少两个第二特征向量生成至少两个扩充第一特征向量和至少两个扩充第二特征向量。包括指令的计算机程序产品可以进一步被配置用于使计算设备基于训练后的二元模型确定至少两个特征中与至少两个正样本相关的一个或以上核心特征,训练后的二元模型通过使用至少两个扩充第一特征向量和至少两个扩充第二特征向量生成。本申请的一部分附加特性可以在下面的描述中进行说明。通过对以下描述和相应附图的研究或者对实施例的生产或操作的了解,本申请的一部分附加特性对于本领域技术人员是明显的。本申请的特征可以通过对以下描述的具体实施例的各种方面的方法、手段和组合的实践或使用得以实现和达到。附图说明本申请将通过示例性实施例进行进一步描述。这些示例性实施例将通过附图进行详细描述。这些实施例是非限制性的示例性实施例,在这些实施例中,各图中相同的编号表示相似的结构,其中:图1是根据本申请的一些实施例所示的示例性线上到线下(O2O)服务系统的示意图;图2是根本文档来自技高网...

【技术保护点】
1.一种系统,包括:/n至少一个存储介质,包括用于用户挖掘的一组指令;/n至少一个处理器,与所述至少一个存储介质通信,其中,当执行所述一组指令时,所述至少一个处理器用于:/n获取至少两个正样本的至少两个第一特征向量,每个所述第一特征向量包括描述所述至少两个正样本中相应的正样本的至少两个特征的第一特征信息;/n获取至少两个负样本的至少两个第二特征向量,每个所述第二特征向量包括描述所述至少两个负样本中相应的正样本的所述至少两个特征的第二特征信息;/n基于所述至少两个第一特征向量和所述至少两个第二特征向量,生成至少两个扩充第一特征向量和至少两个扩充第二特征向量;以及/n在所述至少两个特征中,基于训练后的二元模型确定与所述至少两个正样本相关的一个或以上核心特征,所述训练后的二元模型通过使用所述至少两个扩充第一特征向量和所述至少两个扩充第二特征向量生成。/n

【技术特征摘要】
【国外来华专利技术】1.一种系统,包括:
至少一个存储介质,包括用于用户挖掘的一组指令;
至少一个处理器,与所述至少一个存储介质通信,其中,当执行所述一组指令时,所述至少一个处理器用于:
获取至少两个正样本的至少两个第一特征向量,每个所述第一特征向量包括描述所述至少两个正样本中相应的正样本的至少两个特征的第一特征信息;
获取至少两个负样本的至少两个第二特征向量,每个所述第二特征向量包括描述所述至少两个负样本中相应的正样本的所述至少两个特征的第二特征信息;
基于所述至少两个第一特征向量和所述至少两个第二特征向量,生成至少两个扩充第一特征向量和至少两个扩充第二特征向量;以及
在所述至少两个特征中,基于训练后的二元模型确定与所述至少两个正样本相关的一个或以上核心特征,所述训练后的二元模型通过使用所述至少两个扩充第一特征向量和所述至少两个扩充第二特征向量生成。


2.根据权利要求1所述的系统,其特征在于,为了获取所述至少两个正样本的所述至少两个第一特征向量,所述至少一个处理器用于:
获取与一个或以上目标特征有关的一个或以上选择标准;
获取至少两个样本的所述一个或以上目标特征的第三特征信息;以及
基于所述第三特征信息和所述一个或以上选择标准,选择来自所述至少两个样本的所述至少两个正样本。


3.根据权利要求2所述的系统,其特征在于,为了获取所述至少两个负样本的所述至少两个第二特征向量,所述至少一个处理器还用于:
在所述至少两个样本中,选择至少两个初始负样本;
获取所述至少两个初始负样本的所述一个或以上目标特征的第四特征信息;以及
基于所述第四特征信息和所述一个或以上选择标准,在所述至少两个初始负样本中,选择所述至少两个负样本。


4.根据权利要求1至3任一项所述的系统,其特征在于,为了确定所述至少两个扩充第一特征向量和所述至少两个扩充第二特征向量,所述至少一个处理器还用于:
确定所述第一特征向量中每一对第一特征向量之间的第一向量差;
将所述第一特征向量中每一对第一特征向量之间的所述第一向量差指定为所述扩充第一特征向量之一;
确定每一对第一特征向量和第二特征向量之间的第二向量差;以及
将每一对第一特征向量和第二特征向量之间的所述第二向量差指定为所述扩充第二特征向量之一。


5.根据权利要求1至4任一项所述的系统,其特征在于,为了确定所述至少两个扩充第一特征向量和所述至少两个第二特征向量,所述至少一个处理器还用于:
标准化所述至少两个第一特征向量;
标准化所述至少两个第二特征向量;以及
基于至少两个标准化的所述第一特征向量和至少两个标准化的所述第二特征向量,确定所述至少两个扩充第一特征向量和所述至少两个扩充第二特征向量。


6.根据权利要求1至5任一项所述的系统,其特征在于,为了确定与所述至少两个正样本相关的所述一个或以上的核心特征,所述至少一个处理器还用于:
基于所述训练后的二元模型确定所述至少两个特征的至少两个权重;
根据所述对应的权重排列所述至少两个特征;以及
基于排列结果,确定所述特征中的所述一个或以上核心特征。


7.根据权利要求1至6任一项所述的系统,其特征在于,所述至少一个处理器还用于:
基于所述一个或以上核心特征和所述至少两个第一特征向量,生成所述至少两个正样本的虚拟简档,其中所述一个或以上核心特征中的每一个在所述虚拟简档中具有对应的第一参考值。


8.根据权利要求7所述的系统,其特征在于,为了生成所述至少两个正样本的所述虚拟简档,所述至少一个处理器还用于:
基于所述至少两个第一特征向量,确定所述一个或以上核心特征中的每一个的平均特征值;以及
将所述平均特征值指定为所述虚拟简档的相应核心特征的所述第一参考值。


9.根据权利要求7或8所述的系统,其特征在于,为了生成所述至少两个正样本的所述虚拟简档,所述至少一个处理器还用于:
基于所述至少两个第二特征向量,确定所述一个或以上核心特征中的每一个的第二参考值;
基于所述一个或以上核心特征中的每一个的所述第二参考值,过滤所述至少两个第一特征向量;以及
使用过滤后的第一特征向量来生成所述至少两个正样本的所述虚拟简档。


10.根据权利要求7至9所述的系统,其特征在于,所述至少一个处理器还用于:
获取至少两个样本的所述一个或以上核心特征的第五特征信息;以及
基于所述正样本的所述虚拟简档和所述第五特征信息,在所述至少两个样本中识别至少两个目标样本。


11.一种在计算设备上实现的方法,所述计算设备具有至少一个处理器、至少一个计算机可读存储介质和连接到网络的通信平台,所述方法包括:
获取至少两个正样本的至少两个第一特征向量,每个所述第一特征向量包括描述所述至少两个正样本中相应的正样本的至少两个特征的第一特征...

【专利技术属性】
技术研发人员:刘跃翔李奘曹利锋常智华凌宏博徐翔
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1