基于移动终端的用户行为相似度识别方法、系统及装置制造方法及图纸

技术编号:19060410 阅读:47 留言:0更新日期:2018-09-29 12:53
一种基于移动终端的用户行为相似度识别方法,对于海量用户数据,在数据分析时对一人多机的移动终端先进行了识别并关联,并结合用户移动终端线上行为数据和线下LBS数据,量化了用户之间行为特征关联关系,使得可准确判断多部移动终端是否为一人所用,准确提取用户线上行为特征,准确刻画用户的线下移动轨迹和精准计算任意终端间的线上、线下行为相似度,为企业定位目标用户提供数据支持。相应地,本申请还提供了一种基于移动终端的用户行为相似度识别系统及装置,以及一种计算机可读存储介质。

【技术实现步骤摘要】
基于移动终端的用户行为相似度识别方法、系统及装置
本专利技术涉及大数据
,具体涉及一种基于移动终端的用户行为相似度识别方法、系统及装置。
技术介绍
随着移动互联网的快速发展,中国手机网民的规模已达8亿多,占中国总体网民的96.3%。大量的移动终端用户每天的线上线下行为为我们提供了大量丰富的数据,而产生这些数据的主体之间的关联度一直缺乏精准的量化。现有技术中,通常是利用开发好的几个标签数值化后加权求和得到一个分数,来计算用户间的相似度,这样计算出的结果往往很粗糙,不能体现用户当前状态下的行为偏好,这样的数据用于企业精准营销,效果差强人意。目前对于用户相似性的研究项目大多简单使用用户的标签加权得到用户之间的相似度,由于标签的维度不全,实时性不佳,实际应用中诸多弊端。
技术实现思路
本申请提供一种基于移动终端的用户行为相似度识别方法、系统及装置,旨在结合用户移动终端线上行为数据和线下LBS位置信息,量化用户之间行为特征关联关系。根据第一方面,一种实施例中提供一种基于移动终端的用户行为相似度识别方法,包括:数据获取步骤,获取至少两部移动终端的指纹信息、所述移动终端的LBS位置信息以及所述移动终端安装的app多维度行为数据信息,所述app多维度行为数据信息包括:app已装卸载行为数据、app卸载行为数据和WiFi连接行为数据;设备关联步骤,根据所述指纹信息和所述app多维度行为数据信息,对一人多机的移动终端进行关联并生成相应地标记信息;线上行为相似度计算步骤,根据所述app多维度行为数据提取用户线上行为特征矩阵,根据所述用户线上行为特征矩阵,计算用户之间的线上行为相似度;线下行为相似度计算步骤,根据所述LBS位置信息,聚合密度较高的报点,得到用户历史轨迹特征矩阵,根据所述用户历史轨迹特征矩阵,计算用户之间的线下行为相似度;综合分析步骤,根据所述标记信息、线上行为相似度和线下行为相似度,量化用户行为相似度。在一些实施例,所述设备关联步骤包括:根据所述指纹信息和所述app多维度行为数据信息,建立用户指纹信息和app多维行为数据之间的对应关联关系,通过设备指纹和app多维标识的交叉定位分析,确定一人多机备关联度,在关联度高时,对相应地移动终端进行关联并生成相应地标记信息。在一些实施例,所述线上行为相似度计算步骤包括计算app安装特征相似度和计算WiFi特征关联度,其中,所述WiFi特征关联度包括工作时段WiFi使用特征关联度和休息时段WiFi使用特征关联度。在一些实施例,所述app安装特征相似度使用广义Jaccard相关系数计算,其公式为:其中,Ci,Cj为设备安装app的特征向量,m表示app的渗透率。在一些实施例,所述WiFi特征关联度采用余弦相似度计算,其公式为:其中,xa、xb分别为用户a、用户b的WiFi使用特征向量,表示用户连接使用某WiFi的强度。在一些实施例,所述线下行为相似度计算步骤:根据用户历史行为特征剔除用户历史LBS信息中的LBS噪声报点,得到优化后的用户报点位置;对所述优化后的用户报点位置进行聚类分析,得到用户聚合行为轨迹;将所述用户聚合行为轨迹进行二进制编码,利用所述编码计算所述用户聚合行为轨迹的权重;根据所述用户聚合行为轨迹的权重,计算两个用户之间任意两条轨迹的海明距离,将所述海明距离归一化处理,得到两条轨迹的相似度;根据两个用户之间所有轨迹两两之间的海明距离,得到两个用户的聚合行为轨迹相似度。在一些实施例,所述用户聚合行为轨迹的权重其中,表示用户u的第i条轨迹的权重第k的位编码;其中,其中,r表示轨迹点,u为用户总数,Tu表示用户u的所有轨迹点的集合,{u:r∈Tu}为轨迹中包含轨迹点r的用户数目;其中,为轨迹点的权重映射规则;其中,表示用户u的轨迹i中轨迹点j的第k的位编码。根据第二方面,一种实施例中提供一种基于移动终端的用户行为相似度识别的系统,包括:数据获取模块,用于获取至少两部移动终端的指纹信息、所述移动终端的LBS位置信息以及所述移动终端安装的app多维度行为数据信息,所述app多维度行为数据信息包括:app安装/再装/卸载行为数据、app点击使用行为数据和WIFI连接行为数据;设备关联模块,用于根据所述指纹信息和所述app多维度行为数据信息,对一人多机的移动终端进行关联并生成相应地标记信息;线上行为相似度计算模块,用于根据所述app多维度行为数据提取用户线上行为特征矩阵,根据所述用户线上行为特征矩阵,计算用户之间的线上行为相似度;线下行为相似度计算模块,用于根据所述LBS位置信息,聚合密度较高的报点,得到用户历史轨迹特征矩阵,根据所述用户历史轨迹特征矩阵,计算用户之间的线下行为相似度;综合分析模块,用于根据所述标记信息、线上行为相似度和线下行为相似度,量化用户行为相似度。根据第三方面,一种实施例中提供一种基于移动终端的用户行为相似度识别的装置,包括:存储器,用于存储程序;处理器,用于通过执行所述存储器存储的程序以实现如第一方面任一项所述的方法。根据第四方面,一种实施例中提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如第一方面任一项所述的方法。依据上述实施例,由于本申请在数据分析时对一人多机的移动终端先进行了识别并关联,并结合用户移动终端线上行为数据和线下LBS数据,量化了用户之间行为特征关联关系,使得可准确判断多部移动终端是否为一人所用,准确提取用户线上行为特征,准确刻画用户的线下移动轨迹和精准计算任意终端间的线上、线下行为相似度,为企业定位目标用户提供数据支持。附图说明图1为一种基于移动终端的用户行为相似度识别方法流程图;图2为一种实施例的线下行为相似度计算步骤流程图。具体实施方式下面通过具体实施方式结合附图对本专利技术作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。用户行为之间的相似性在企业的数据运营管理和营销方面都大有用武之地,研究设备两两之间的相似性非常必要,而对于较大用户体量的移动端多维度的线上线下行为数据来说,整个模型处理计算量非常庞大,性能和精度也是我们不断优化的关键点。现有一些算法在处理大规模用户线上线下数据的时候,计算用户两两之间的相似度涉及庞大的数据计算量,会占用大量的计算资源,在大规模应用的时候,效率和及时性都收到很大的制约;基于用户标签的相似度计算,评价的维度有限,有些标签无法细致地反应用本文档来自技高网...

【技术保护点】
1.一种基于移动终端的用户行为相似度识别方法,其特征在于,包括:数据获取步骤,获取至少两部移动终端的指纹信息、所述移动终端的LBS位置信息以及所述移动终端安装的app多维度行为数据信息,所述app多维度行为数据信息包括:app已装卸载行为数据、app卸载行为数据和WiFi连接行为数据;设备关联步骤,根据所述指纹信息和所述app多维度行为数据信息,对一人多机的移动终端进行关联并生成相应地标记信息;线上行为相似度计算步骤,根据所述app多维度行为数据提取用户线上行为特征矩阵,根据所述用户线上行为特征矩阵,计算用户之间的线上行为相似度;线下行为相似度计算步骤,根据所述LBS位置信息,聚合密度较高的报点,得到用户历史轨迹特征矩阵,根据所述用户历史轨迹特征矩阵,计算用户之间的线下行为相似度;综合分析步骤,根据所述标记信息、线上行为相似度和线下行为相似度,量化用户行为相似度。

【技术特征摘要】
1.一种基于移动终端的用户行为相似度识别方法,其特征在于,包括:数据获取步骤,获取至少两部移动终端的指纹信息、所述移动终端的LBS位置信息以及所述移动终端安装的app多维度行为数据信息,所述app多维度行为数据信息包括:app已装卸载行为数据、app卸载行为数据和WiFi连接行为数据;设备关联步骤,根据所述指纹信息和所述app多维度行为数据信息,对一人多机的移动终端进行关联并生成相应地标记信息;线上行为相似度计算步骤,根据所述app多维度行为数据提取用户线上行为特征矩阵,根据所述用户线上行为特征矩阵,计算用户之间的线上行为相似度;线下行为相似度计算步骤,根据所述LBS位置信息,聚合密度较高的报点,得到用户历史轨迹特征矩阵,根据所述用户历史轨迹特征矩阵,计算用户之间的线下行为相似度;综合分析步骤,根据所述标记信息、线上行为相似度和线下行为相似度,量化用户行为相似度。2.如权利要求1所述的方法,其特征在于,所述设备关联步骤包括:根据所述指纹信息和所述app多维度行为数据信息,建立用户指纹信息和app多维行为数据之间的对应关联关系,通过设备指纹和app多维标识的交叉定位分析,确定一人多机备关联度,在关联度高时,对相应地移动终端进行关联并生成相应地标记信息。3.如权利要求1所述的方法,其特征在于,所述线上行为相似度计算步骤包括计算app安装特征相似度和计算WiFi特征关联度,其中,所述WiFi特征关联度包括工作时段WiFi使用特征关联度和休息时段WiFi使用特征关联度。4.如权利要求3所述的方法,其特征在于,所述app安装特征相似度使用广义Jaccard相关系数计算,其公式为:其中,Ci,Cj为设备安装app的特征向量,m表示app的渗透率。5.如权利要求3所述的方法,其特征在于,所述WiFi特征关联度采用余弦相似度计算,其公式为:其中,xa、xb分别为用户a、用户b的WiFi使用特征向量,表示用户连接使用某WiFi的强度。6.如权利要求1所述的方法,其特征在于,所述线下行为相似度计算步骤:根据用户历史行为特征剔除用户历史LBS信息中的LBS噪声报点,...

【专利技术属性】
技术研发人员:贺智谋洪晶陈宇
申请(专利权)人:深圳市和讯华谷信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1