【技术实现步骤摘要】
【国外来华专利技术】一种用于用户分析的系统和方法
本申请一般涉及用户分析,更具体地,涉及用于挖掘用户的特征并生成用户的虚拟简档的系统和方法。
技术介绍
在互联网技术中,用户特征挖掘通常是服务系统开发和运行的关键。通过用户特征挖掘,可以识别和量化各种用户类型的特征,从而为用户分类、个性化服务和营销提供基础。仅作为示例,可以确定服务系统中至少两个活动用户的核心特征,并且这样的核心特征可以用于识别具有与活动用户类似的特征的潜在活动用户。因此,可以对所识别的潜在活动用户采用活动营销策略。因此,期望提供用于挖掘用户特征的有效系统和方法。
技术实现思路
根据本申请的一个方面,提供了一个系统。该系统可以包括至少一个存储介质和至少一个与该至少一个存储介质通信的处理器。存储介质可以包括用于用户挖掘的一组指令。当执行该组指令时,可以指示所述至少一个处理器获取至少两个正样本的至少两个第一特征向量和至少两个负样本的至少两个第二特征向量。每个第一特征向量可以包括描述至少两个正样本中相应的正样本的至少两个特征的第一特征信息。每个第二特征向量可以包括描述至少两个负样本中相应的正样本的至少两个特征的第二特征信息。所述至少一个处理器还可以用于基于至少两个第一特征向量和至少两个第二特征向量来生成至少两个扩充第一特征向量和至少两个扩充第二特征向量。至少一个处理器还可以用于在至少两个特征中,基于训练后的二元模型确定与至少两个正样本相关的一个或以上核心特征,训练后的二元模型通过使用至少两个扩充第一特征向量和至少两个扩充第二特征向量生成。在一些实施例中 ...
【技术保护点】
1.一种系统,包括:/n至少一个存储介质,包括用于用户挖掘的一组指令;/n至少一个处理器,与所述至少一个存储介质通信,其中,当执行所述一组指令时,所述至少一个处理器用于:/n获取至少两个正样本的至少两个第一特征向量,每个所述第一特征向量包括描述所述至少两个正样本中相应的正样本的至少两个特征的第一特征信息;/n获取至少两个负样本的至少两个第二特征向量,每个所述第二特征向量包括描述所述至少两个负样本中相应的正样本的所述至少两个特征的第二特征信息;/n基于所述至少两个第一特征向量和所述至少两个第二特征向量,生成至少两个扩充第一特征向量和至少两个扩充第二特征向量;以及/n在所述至少两个特征中,基于训练后的二元模型确定与所述至少两个正样本相关的一个或以上核心特征,所述训练后的二元模型通过使用所述至少两个扩充第一特征向量和所述至少两个扩充第二特征向量生成。/n
【技术特征摘要】
【国外来华专利技术】1.一种系统,包括:
至少一个存储介质,包括用于用户挖掘的一组指令;
至少一个处理器,与所述至少一个存储介质通信,其中,当执行所述一组指令时,所述至少一个处理器用于:
获取至少两个正样本的至少两个第一特征向量,每个所述第一特征向量包括描述所述至少两个正样本中相应的正样本的至少两个特征的第一特征信息;
获取至少两个负样本的至少两个第二特征向量,每个所述第二特征向量包括描述所述至少两个负样本中相应的正样本的所述至少两个特征的第二特征信息;
基于所述至少两个第一特征向量和所述至少两个第二特征向量,生成至少两个扩充第一特征向量和至少两个扩充第二特征向量;以及
在所述至少两个特征中,基于训练后的二元模型确定与所述至少两个正样本相关的一个或以上核心特征,所述训练后的二元模型通过使用所述至少两个扩充第一特征向量和所述至少两个扩充第二特征向量生成。
2.根据权利要求1所述的系统,其特征在于,为了获取所述至少两个正样本的所述至少两个第一特征向量,所述至少一个处理器用于:
获取与一个或以上目标特征有关的一个或以上选择标准;
获取至少两个样本的所述一个或以上目标特征的第三特征信息;以及
基于所述第三特征信息和所述一个或以上选择标准,选择来自所述至少两个样本的所述至少两个正样本。
3.根据权利要求2所述的系统,其特征在于,为了获取所述至少两个负样本的所述至少两个第二特征向量,所述至少一个处理器还用于:
在所述至少两个样本中,选择至少两个初始负样本;
获取所述至少两个初始负样本的所述一个或以上目标特征的第四特征信息;以及
基于所述第四特征信息和所述一个或以上选择标准,在所述至少两个初始负样本中,选择所述至少两个负样本。
4.根据权利要求1至3任一项所述的系统,其特征在于,为了确定所述至少两个扩充第一特征向量和所述至少两个扩充第二特征向量,所述至少一个处理器还用于:
确定所述第一特征向量中每一对第一特征向量之间的第一向量差;
将所述第一特征向量中每一对第一特征向量之间的所述第一向量差指定为所述扩充第一特征向量之一;
确定每一对第一特征向量和第二特征向量之间的第二向量差;以及
将每一对第一特征向量和第二特征向量之间的所述第二向量差指定为所述扩充第二特征向量之一。
5.根据权利要求1至4任一项所述的系统,其特征在于,为了确定所述至少两个扩充第一特征向量和所述至少两个第二特征向量,所述至少一个处理器还用于:
标准化所述至少两个第一特征向量;
标准化所述至少两个第二特征向量;以及
基于至少两个标准化的所述第一特征向量和至少两个标准化的所述第二特征向量,确定所述至少两个扩充第一特征向量和所述至少两个扩充第二特征向量。
6.根据权利要求1至5任一项所述的系统,其特征在于,为了确定与所述至少两个正样本相关的所述一个或以上的核心特征,所述至少一个处理器还用于:
基于所述训练后的二元模型确定所述至少两个特征的至少两个权重;
根据所述对应的权重排列所述至少两个特征;以及
基于排列结果,确定所述特征中的所述一个或以上核心特征。
7.根据权利要求1至6任一项所述的系统,其特征在于,所述至少一个处理器还用于:
基于所述一个或以上核心特征和所述至少两个第一特征向量,生成所述至少两个正样本的虚拟简档,其中所述一个或以上核心特征中的每一个在所述虚拟简档中具有对应的第一参考值。
8.根据权利要求7所述的系统,其特征在于,为了生成所述至少两个正样本的所述虚拟简档,所述至少一个处理器还用于:
基于所述至少两个第一特征向量,确定所述一个或以上核心特征中的每一个的平均特征值;以及
将所述平均特征值指定为所述虚拟简档的相应核心特征的所述第一参考值。
9.根据权利要求7或8所述的系统,其特征在于,为了生成所述至少两个正样本的所述虚拟简档,所述至少一个处理器还用于:
基于所述至少两个第二特征向量,确定所述一个或以上核心特征中的每一个的第二参考值;
基于所述一个或以上核心特征中的每一个的所述第二参考值,过滤所述至少两个第一特征向量;以及
使用过滤后的第一特征向量来生成所述至少两个正样本的所述虚拟简档。
10.根据权利要求7至9所述的系统,其特征在于,所述至少一个处理器还用于:
获取至少两个样本的所述一个或以上核心特征的第五特征信息;以及
基于所述正样本的所述虚拟简档和所述第五特征信息,在所述至少两个样本中识别至少两个目标样本。
11.一种在计算设备上实现的方法,所述计算设备具有至少一个处理器、至少一个计算机可读存储介质和连接到网络的通信平台,所述方法包括:
获取至少两个正样本的至少两个第一特征向量,每个所述第一特征向量包括描述所述至少两个正样本中相应的正样本的至少两个特征的第一特征...
【专利技术属性】
技术研发人员:刘跃翔,李奘,曹利锋,常智华,凌宏博,徐翔,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。