基于用户行为数据的用户标识关联方法技术

技术编号:16885913 阅读:42 留言:0更新日期:2017-12-27 03:42
本发明专利技术提供了一种基于用户行为数据的用户标识关联方法,首先对海量的用户行为进行识别,统一格式后,提取与ID之间关联相关的特征数据,判断ID的类别,根据特征数据将属于个人ID的不同ID两两之间进行关联得到的不同ID之间相似度,并分别与阈值进行比较,判断关联的ID是够属于同一用户,最后根据ID的关联性得到属于同一用户的所有ID,根据这些ID对应的数据,能够分析出用户日常行为规律,因此,本发明专利技术的基于用户行为数据的用户标识关联方法能够对收集到的海量的用户行为进行分析,得到属于同一用户的所有ID,从而根据这些ID对应的数据掌握用户的日常行为规律。

User identity based method based on user behavior data

The invention provides a user identification method based on correlation of user behavior data, identify the first mass of user behavior, unified format, feature extraction of data associated with the association between ID, determine the ID categories, the similarity between different ID are correlated between 22 different ID according to the characteristics of data will belong to the individual ID respectively, and compared with the threshold, to judge the associated ID is enough to belong to the same user, according to the relevance of ID ID all belong to the same user, according to the corresponding ID data, we can analyze the user's daily behavior, therefore, the invention of the user identification method based on user behavior data related to user behavior analysis on the collected mass, all ID belong to the same user, according to the ID data corresponding to the user on the master Regular behavior law.

【技术实现步骤摘要】
基于用户行为数据的用户标识关联方法
本专利技术属于互联网
,具体涉及一种基于用户行为数据的用户标识关联方法。
技术介绍
随着物联网、云计算、移动互联网等网络新技术的应用和发展与普及,社会信息化进程进入数据时代,海量数据的产生与流转成为常态。未来20年,全球50亿人将实现联网,“人人有终端、处处可上网、时时在链接”,这将使全球数据量呈几何式快速增长。预计到2020年,全球数据使用量将达到约40ZB(1ZB=10亿TB)将涵盖经济社会发展各个领域,成为新的重要驱动力。在多元化移动设备时代,用户在互联网上的场景越来越多元且分散,一个人一天的行为可能是这样:早晨在智能手环的振动闹铃中醒来,通过智能家电完成早餐的快捷制作,中午在公司电脑上看看视频,逛逛淘宝,晚上在智能电视上追剧,同时用手机打发一天中的碎片时间。而这些行为可能在不同的地点发生,在上班路上、办公室里、家里以及周末常去的聚会场所。这种使用不同设备在不同的场景、不同地理位置下进行信息交互成为了现今典型的用户行为模式。对于用户来说,这样的生活方式无疑是便捷且现代化的体验,但是对于数据分析人员来说,在识别用户、用户行为和精准营销带来本文档来自技高网...
基于用户行为数据的用户标识关联方法

【技术保护点】
一种基于用户行为数据的用户标识关联方法,其特征在于,包括以下步骤:步骤1,对海量的用户行为进行识别,并将每条用户行为中同一类型的数据的格式进行统一;步骤2,对于每条用户行为,从统一格式后的数据中提取与ID关联相关的特征数据;步骤3,计算ID的类别,所述ID的类别包含个人ID、群体ID、组织ID、以及专用设备ID;步骤4,根据所述特征数据将属于个人ID的不同ID两两之间进行关联得到的不同ID之间相似度;步骤5,设定阈值,将不同ID之间的相似度均分别与所述阈值进行比较,确定相互关联的两个ID是否属于同一用户;步骤6,根据ID之间的传递性,得到属于用一用户的所有ID的集合。

【技术特征摘要】
1.一种基于用户行为数据的用户标识关联方法,其特征在于,包括以下步骤:步骤1,对海量的用户行为进行识别,并将每条用户行为中同一类型的数据的格式进行统一;步骤2,对于每条用户行为,从统一格式后的数据中提取与ID关联相关的特征数据;步骤3,计算ID的类别,所述ID的类别包含个人ID、群体ID、组织ID、以及专用设备ID;步骤4,根据所述特征数据将属于个人ID的不同ID两两之间进行关联得到的不同ID之间相似度;步骤5,设定阈值,将不同ID之间的相似度均分别与所述阈值进行比较,确定相互关联的两个ID是否属于同一用户;步骤6,根据ID之间的传递性,得到属于用一用户的所有ID的集合。2.根据权利要求1所述的基于用户行为数据的用户标识关联方法,其特征在于:其中,所述步骤2中提取的用户行为之间关联相关的特征数据的类型包括但不限于:ID账号数据;设备相关数据;地理位置、场所数据;线上行为数据;线下行为数据;标签属性数据以及时间数据。3.根据权利要求1所述的基于用户行为数据的用户标识关联方法,其特征在于:其中,步骤3中计算得到的ID类别属于非个人ID的作为不同个人ID之间关联的特征数据。4.根据权利要求1所述的基于用户行为数据的用户标识关联方法,其特征在于:其中,所述步骤3中,ID类别采用以下方法判断:使用账号级别特征、设备ID级别特征计算ID类别;使用上网行为特征计算ID类别;使用设备特征信息计算ID类别;使用地理位置特征、场所特征计算ID类别。5.根据权利要求1所述的基于用户行为数据的用户标识关联方法,其特征在于:其中,所述步骤3中,ID类别采用决策树模型进行计算。6.根据权利要求5所述的基于用户行为数据的用户标识关联方法,其特征在于:采用决策树模型进行计算的方法如下:步骤3-1,选取一个已知ID类别的用户行为样本,获取样本中ID在一段时间内的全部行为数据,并统计不同类型的ID下各行为数据的分布,得到决策树阈值;步骤3-2,统计计算ID在一段时间内全部行为数据的分布,并与所述决策树阈值进行比较,小于所述决策树阈值,则该ID为非个人ID,大于等于所述决策树阈值,则该ID为个人ID。7.根据权利要求1...

【专利技术属性】
技术研发人员:汤奇峰宁绍军
申请(专利权)人:晶赞广告上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1