【技术实现步骤摘要】
同人识别方法、装置、设备和存储介质
本专利技术实施例涉及大数据处理
,尤其涉及一种同人识别方法、装置、设备和存储介质。
技术介绍
随着互联网技术的日渐成熟,人们的消费和行为习惯发生了巨大的变化,人们连入互联网的方式也呈多元发展。在日常生活中,用户可以随时随地的通过手机APP、PC、微信小程序、H5、O2O中的任意一种方式去连入某公司不同域的业务系统,使得用户能够浏览、查询或咨询相关感兴趣的内容。相应的,该公司不同域的业务系统中就会产生同一个用户的不同行为特征数据。在未进行处理前,这些行为特征数据彼此之间可能是孤立的,不仅无法利用起来,而且还不便于管理,所以出于加强数据管理的目的,很多公司会建立以“人”为中心的“一人一档”数据管理业务,简单来说就是会将各种业务系统中的行为特征数据进行汇聚起来,然后将同一个用户在该公司全域的行为特征数据串联在一起,消除数据孤岛。这个过程需要应用到同人识别技术,也就是需要从大量的行为特征数据中快速确定哪些行为特征数据是属于同一个用户的。目前,现有技术中,业界较多的是通过MapReduce以置 ...
【技术保护点】
1.一种同人识别方法,其特征在于,所述方法包括:/n获取各个业务域的用户信息数据及各个所述用户信息数据之间的关联关系;/n依据所述用户信息数据及所述关联关系构建无向连通图,所述无向连通图中的每一个节点对应一个所述用户信息数据,每一条无向边对应一个所述关联关系;/n给所述无向连通图中的每一个连通子图分配唯一标识符。/n
【技术特征摘要】
1.一种同人识别方法,其特征在于,所述方法包括:
获取各个业务域的用户信息数据及各个所述用户信息数据之间的关联关系;
依据所述用户信息数据及所述关联关系构建无向连通图,所述无向连通图中的每一个节点对应一个所述用户信息数据,每一条无向边对应一个所述关联关系;
给所述无向连通图中的每一个连通子图分配唯一标识符。
2.根据权利要求1所述的同人识别方法,其特征在于,在所述给所述无向连通图中的每一个连通子图分配唯一标识码的步骤之后,所述方法还包括:
周期性获取各个业务域新增的用户信息数据及各个所述用户信息数据之间新增的关联关系;
将新增的所述用户信息数据作为新的节点添加到所述无向连通图中;
依据新增的所述关联关系将所述无向连通图中彼此关联的所述用户信息数据通过所述无向边相连接;
给所述无向连通图中未分配唯一标识符的连通子图分配唯一标识符;
判断所述无向连通图中是否存在具有两个或多个唯一标识符的连通子图;
若是,则按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的唯一标识符。
3.根据权利要求2所述的同人识别方法,其特征在于,所述按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的唯一标识符的步骤包括:
从所述两个或多个唯一标识符中选择分配时间最早的一个作为最终的唯一标识符;
或者,
从所述两个或多个唯一标识符中选择分配时间最晚的一个作为最终的唯一标识符;
或者,
从所述两个或多个唯一标识符中随机选择一个作为最终的唯一标识符。
4.根据权利要求1所述的同人识别方法,其特征在于,在所述给所述无向连通图中的每一个连通子图分配唯一标识码的步骤之后,所述方法还包括:
依据用户信息数据的生成时间,对每一个连通子图所对应的用户的行为轨迹进行统计分析,以确定每一个用户的感兴趣程度;
根据所述感兴趣程度,向对应的用户推送对应的内容信息或提供对应的客户服务。
5.一种同人识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取各个业务域的用户信息数据及各个所述用户信息数据之间的关联关系;
构建模块,用于依据所述用户信息数据及所述关联关系构建无向连通图...
【专利技术属性】
技术研发人员:钟奇,孙昌青,蔡龙颜,
申请(专利权)人:广州小鹏自动驾驶科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。