社交圈关键用户提取方法及装置制造方法及图纸

技术编号:17407165 阅读:37 留言:0更新日期:2018-03-07 04:57
本发明专利技术提供一种社交圈关键用户提取方法及装置,其中,方法包括:获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;在所述关注关系网中提取用户之间相互关注的最小关注环,最小关注环中的每个用户仅与最小关注环中的其中两个用户互相关注;当各所述最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈;根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户。本发明专利技术提供的社交圈关键用户提取方法及装置能够提高信息推送效果。

Key user extraction methods and devices in social circles

The invention provides a method and a device, extracting the key users of social circle, method: obtain set all the users in the region in the social platform social data, the social data include: on the relationship between users and interactive speech data; the minimum attention ring of mutual concern between network users in extraction the minimum attention each user only with minimal attention in the ring ring in which two users concerned about each other; when the number between each of the minimum attention ring overlap user meets the design requirements, the minimum attention ring in the merger, in order to get the social circle; according to the total number of users, the users of the overlap the social circle and the speech interaction data to extract key users in the social circle. The key user extraction method and device of the social circle provided by the invention can improve the effect of information push.

【技术实现步骤摘要】
社交圈关键用户提取方法及装置
本专利技术涉及社交圈数据处理技术,尤其涉及一种社交圈关键用户提取方法及装置。
技术介绍
自上世纪九十年代起,人们从电话、书信逐渐转变为通过互联网进行信息交流和推送。从最初只能通过聊天软件进行信息交流的方式,发展到目前集聊天、文章推送、图片浏览、文件传送等功能于一体的方式,例如:微博、微信、视频社交平台等。无论哪一个社交平台,用户都与其它用户建立联系,形成社交圈,例如:社交圈内可以包括:亲人、同学、朋友、同事、陌生人、以及关注的名人、企业或公众号等。用户所形成的社交圈通常可以依靠拓扑结构来进行划分成多个,同一个社交圈中的用户可能具有较为相似的喜好。因此,目前的信息推广的方式通常是有针对性地向各社交圈来推送信息。但是,由于社交圈的规模不同,每个用户的影响力也不同,若接收到推送信息的用户的影响力较小,则不能够达到较好的信息推送效果。
技术实现思路
本专利技术提供一种社交圈关键用户提取方法及装置,能够提高信息推送效果。本专利技术一方面提供一种社交圈关键用户提取方法,包括:获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;在所述关注关系网中提取用户之间相互关注的最小关注环,所述最小关注环中的每个用户仅与所述最小关注环中的其中两个用户互相关注;当各所述最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈;根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户。本专利技术另一方面提供一种社交圈关键用户提取装置,包括:社交数据获取模块,用于获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;最小关注环提取模块,用于在所述关注关系网中提取用户之间相互关注的最小关注环,所述最小关注环中的每个用户仅与所述最小关注环中的其中两个用户互相关注;关注环合并模块,用于当各所述最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈;关键用户提取模块,用于根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户。本专利技术所提供的技术方案,通过获取设定区域内所有用户在社交平台上的关注关系网和言论互动数据,然后在关注关系网中提取用户之间相互关注的最小关注环,当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈,最后根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。由于关键用户在社交圈中的影响力较大,向关键用户推送信息,则与该关键用户有互相关注关系的用户、以及与该关键用户有言论互动的用户都能够知晓推送信息,进而扩大了影响力,提高了信息推送的效果。附图说明图1为本专利技术实施例一提供的社交圈关键用户提取方法的流程图;图2为本专利技术实施例二提供的社交圈关键用户提取方法的流程图;图3为本专利技术实施例二提供的关注关系网的无向图;图4为本专利技术实施例二提供的关注关系网的矩阵结构;图5为本专利技术实施例三提供的社交圈关键用户提取方法的流程图;图6为本专利技术实施例七提供的社交圈关键用户提取装置的结构示意图;图7为本专利技术实施例八提供的社交圈关键用户提取装置中最小关注环提取模块的结构示意图;图8为本专利技术实施例八提供的社交圈关键用户提取装置中关注环合并模块的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一图1为本专利技术实施例一提供的社交圈关键用户提取方法的流程图。如图1所示,本实施例提供一种社交圈关键用户提取方法,包括:步骤10、获取设定区域内所有用户在社交平台上的社交数据,社交数据包括:用户之间的关注关系网和言论互动数据。社交平台可以为目前常见的一些聊天、交友软件,例如:微博、微信、QQ空间、视频分享平台等。由于社交平台中的用户数量非常庞大,收集全部用户的社交数据进行分析的工作量非常大,并且,通常某一区域内的用户具有较为相似的喜好,因此,本实施例仅获取设定区域内的所有用户的社交数据。例如:获取北京市西城区内所有用户的社交数据。社交数据包括:用户之间的关注关系网和言论互动数据。以微博为例:各用户之间的互动关系可以为:单向关注、相互关注、在某一用户发表的微博下评论、转发某一条微博等。其中,用户之间的相互关注可以组成一个关注关系网。单向关注、在某一用户发表的微博下评论、转发某一条微博等可以作为言论互动数据。再以微信为例:各用户之间的互动关系可以为:互相加为好友、在某一用户的朋友圈中评论、转发某一链接等。其中,用户之间互相加为好友可以组成一个关注关系网,在某一用户的朋友圈中评论、转发某一链接等可以作为言论互动数据。另外,微信中还有一种情况,用户能够接收到某一公众号(用户并未与该公众号加为好友,也未关注该公众号)在朋友圈发表的内容,且能够对该内容进行评论,也属于言论互动数据。本实施例仅以微博为例,对技术方案进行详细的说明,但本领域技术人员可以将本实施例所提供的技术方案应用于微信、QQ空间、视频社交等平台中。首先,获取设定区域内所有用户唯一的序列号,并将所有用户的序列号加入数据库,生成用户列表。然后,获取设定区域内所有用户在社交平台上的关注关系网,具体的,可以将设定区域内的每一个用户作为节点,采用深度遍历或广度遍历的方式,查找到与该用户为相互关注的其它用户,此处的其它用户并不限定在设定区域内。若相互关注的用户已经存在于用户列表中,则继续查找下一用户;若相互关注的用户不在用户列表中,则将该用户的序列号加入用户列表。在用户列表中,根据用户的序列号构建索引,若系列号的首位字符为英文字母,则按照A-Z的顺序建立索引,以便于提高查找效率。各用户之间的相互关注关系可以一个拼接的关系字段来表示:例如:a用户,与其相互关注的用户为b、ce、dmo,则关系字段可以为:b00ce0dmo,以序列号长度最长3位的为基准,不足3位的补数字0。该关系字段能便于后续对用户进行查找和关系切割。之后,通过自动化网页爬取脚本,收集用户列表中每个用户的社交言论数据。由于用户的社交言论数量较大,可以仅收集某一期间内的社交言论数据。以微博为例,收集每个用户在半年内发表的微博被评论或转发的用户的数目。例如:A用户发表了一条微博,这条微博被3个用户进行了评论,被6个用户进行了转发,则评论数目CommentCount为3,转发数目RepostCount为6。记录A用户半年内发表的每一条微博的评论数目和转发数目,并计算半年内的平均评论数目和平均转发数目。另外,还可以记录在A用户发表的微博下进行互动的用户及其互动的次数,该互动的用户若不在用户列表中,则无需记录。步骤20、在关注关系网中提取用户之间相互关注的最小关注环。经过步骤10,获取到的用户的关注关系网,在关注关系网中提取最小关注环。最小关注环中的每个用户仅与该关注环中的其中两个用户互相关注。例如:A用户本文档来自技高网...
社交圈关键用户提取方法及装置

【技术保护点】
一种社交圈关键用户提取方法,其特征在于,包括:获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;在所述关注关系网中提取用户之间相互关注的最小关注环,所述最小关注环中的每个用户仅与所述最小关注环中的其中两个用户互相关注;当各所述最小关注环之间重叠用户的数量满足设定要求时,对各最小关注环进行合并,以得到社交圈;根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户。

【技术特征摘要】
1.一种社交圈关键用户提取方法,其特征在于,包括:获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;在所述关注关系网中提取用户之间相互关注的最小关注环,所述最小关注环中的每个用户仅与所述最小关注环中的其中两个用户互相关注;当各所述最小关注环之间重叠用户的数量满足设定要求时,对各最小关注环进行合并,以得到社交圈;根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户。2.根据权利要求1所述的社交圈关键用户提取方法,其特征在于,在所述关注关系网中提取用户之间相互关注的最小关注环,包括:在所述关注关系网中提取用户之间相互关注的关注环;根据所述言论互动数据对所述关注环进行拆分,以得到最小关注环。3.根据权利要求2所述的社交圈关键用户提取方法,其特征在于,在所述关注关系网中提取用户之间相互关注的关注环,包括:采用深度遍历的方式,在所述关注关系网中提取用户之间相互关注的关注环。4.根据权利要求3所述的社交圈关键用户提取方法,其特征在于,当各所述最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈,包括:获取任意两个最小关注环之间重叠用户的数量;判断所述重叠用户的数量分别与所述重叠用户所在的两个最小关注环中用户总数的比值是否均大于设定值;若是,则将两个最小关注环进行合并,以得到社交圈。5.根据权利要求4所述的社交圈关键用户提取方法,其特征在于,根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户,包括:采用如下公式对社交圈中的各用户的活跃值进行计算:其中,Si为用户的活跃值,t1...

【专利技术属性】
技术研发人员:刘颖慧刘静沙许丹丹
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1