在社交网络中对用户信息处理的方法和装置制造方法及图纸

技术编号:15334433 阅读:82 留言:0更新日期:2017-05-16 21:40
本发明专利技术公开了一种在社交网络中对用户信息处理的方法和装置,涉及互联网技术领域,其中,方法:通过爬取社交网络中的用户信息建立用户信息库,所述用户信息携带用户ID;获取用户话单中访问所述社交网络的URL,并从所述URL中提取用户ID;在所述用户信息库中查找提取的用户ID对应的用户信息,并将用户信息与用户话单中的移动用户号码簿号码或用户上网账号关联。本发明专利技术能够将用户信息与移动用户号码簿号码或用户上网账号关联,以便根据社交网络的用户信息完善用户画像。

【技术实现步骤摘要】
在社交网络中对用户信息处理的方法和装置
本专利技术涉及互联网
,尤其是一种在社交网络中对用户信息处理的方法和装置。
技术介绍
企业传统的产品推广方式包括短信群发、电话外呼以及互联网弹窗等,但这些推广方式精准度不高,而且会造成用户反感。根据用户信息构建用户画像能够进行精准营销。但是,企业本身所具有的用户信息不够全面,从而导致所构建的用户画像不够完善。
技术实现思路
本专利技术实施例所要解决的技术问题是:提供一种在社交网络中对用户信息处理的方法和装置,能够将用户信息与移动用户号码簿号码或用户上网账号关联。根据本专利技术的一方面,提供一种在社交网络中对用户信息处理的方法,包括:通过爬取社交网络中的用户信息建立用户信息库,所述用户信息携带用户ID;获取用户话单中访问所述社交网络的URL,并从所述URL中提取用户ID;在所述用户信息库中查找提取的用户ID对应的用户信息,并将用户信息与用户话单中的移动用户号码簿号码或用户上网账号关联。在一个实施例中,所述通过爬取社交网络中的用户信息建立用户信息库包括:利用用户的账号和密码登录所述社交网络;爬取所述用户的用户信息并存储在所述用户信息库中;爬取所述用户的每个关注人的用户信息并将所述关注人的用户信息存储在所述用户信息库中;将所述关注人作为所述用户,重复执行爬取所述用户的关注人的用户信息并将所述关注人的用户信息存储在所述用户信息库中的操作。在一个实施例中,所述爬取所述用户的关注人的用户信息并将所述关注人的用户信息存储在所述用户信息库中包括:获取所述用户的关注人ID并依次存放在待爬取队列的队尾;爬取待爬取队列的队头的关注人的用户信息并将该关注人的用户信息存储在所述用户信息库中,直至取待爬取队列为空队列。在一个实施例中,在爬取每个用户的用户信息后,将该用户的用户ID存放在已爬取集合中;在爬取所述用户的关注人的用户信息之前,还包括:判断关注人ID是否在已爬取集合中,如果否,则爬取该关注人的用户信息;如果是,则爬取下一个关注人的用户信息。在一个实施例中,以随机时间间隔爬取所述用户的关注人的用户信息。在一个实施例中,如果在建立用户信息库的过程中发现登录所述社交网络的所述用户的账号异常,则利用另一个用户的账号和密码重新登录所述社交网络。根据本专利技术的另一方面,提供一种在社交网络中对用户信息处理的装置,包括:爬虫单元,用于通过爬取社交网络中的用户信息建立用户信息库,所述用户信息携带用户ID;获取单元,用于获取用户话单中访问所述社交网络的URL,并从所述URL中提取用户ID;关联单元,用于在所述用户信息库中查找提取的用户ID对应的用户信息,并将用户信息与用户话单中的移动用户号码簿号码或用户上网账号关联。在一个实施例中,登录模块,用于利用用户的账号和密码登录所述社交网络;爬虫模块,用于爬取所述用户的用户信息并存储在所述用户信息库中;爬取所述用户的关注人的用户信息并将关注人的用户信息存储在所述用户信息库中;将所述关注人作为所述用户,重复执行爬取所述用户的关注人的用户信息并将所述关注人的用户信息存储在所述用户信息库中的操作。在一个实施例中,所述爬虫模块包括:获取子模块,用于获取所述用户的关注人ID并依次存放在待爬取队列的队尾;爬虫子模块,用于爬取待爬取队列的队头的关注人的用户信息并将该关注人的用户信息存储在所述用户信息库中,直至取待爬取队列为空队列。在一个实施例中,所述爬虫模块,还用于在爬取每个用户的用户信息后,将该用户的用户ID存放在已爬取集合中;在爬取所述用户的关注人的用户信息之前,判断关注人ID是否在已爬取集合中,如果否,则爬取该关注人的用户信息;如果是,则爬取下一个关注人的用户信息。在一个实施例中,所述爬虫模块以随机时间间隔爬取所述用户的关注人的用户信息。在一个实施例中,还包括:反防爬单元,用于如果在建立用户信息库的过程中发现登录所述社交网络的所述用户的账号异常,则利用另一个用户的账号和密码重新登录所述社交网络。本专利技术通过爬取社交网络的用户信息建立用户信息库,当获取到话单中用户访问社交网络的URL包含的用户ID后,可以在用户信息库中查询到该用户ID对应的用户信息并把该用户信息与移动用户号码簿号码或用户上网账号,例如ADSL宽带账号关联起来,从而可以完善用户画像,根据完善的用户画像可以提高营销成功率。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术在社交网络中对用户信息处理的方法一个实施例的流程示意图;图2是本专利技术在社交网络中对用户信息处理的方法另一个实施例的流程示意图;图3是本专利技术在社交网络中对用户信息处理的装置一个实施例的结构示意图;图4是本专利技术在社交网络中对用户信息处理的装置另一个实施例的结构示意图;图5是本专利技术在社交网络中对用户信息处理的装置又一个实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。本专利技术的专利技术人发现,社交网络中包含用户的很多公开信息,如果能将社交网络中的用户信息与用户本身关联,则可以使得获取到的用户信息更加全面。图1是本专利技术在社交网络中对用户信息处理的方法一个实施例的流程示意图。如图1所示,该方法包括如下步骤:步骤102,通过爬取社交网络中的用户信息建立用户信息库,该用户信息携带用户ID。这里,社交网络例如可以是新浪微博、豆瓣网等。以新浪微博为例,每个微博用户的用户信息URL具有固定的格式,URL携带有用户ID。通过爬取社交网络所有注册用户的用户信息,可以建立社交网络的用户信息库。步骤104,获取用户话单中访问社交网络的URL,并从URL中提取用户ID。当用户话单中携带访问某个社交网络,例如新浪微博的记录时,可以从访问新浪微博的URL中提取出用户ID。步骤106,在用户信息库中查找提取的用户ID对应的用户信息,并将用户信息与用户话单中的用户上网账号关联。用户话单中包含移动用户号码簿号码(MDN)或用户上网账号,例如ADSL宽带账号。在用户信息库中查找到提取的本文档来自技高网...
在社交网络中对用户信息处理的方法和装置

【技术保护点】
一种在社交网络中对用户信息处理的方法,其特征在于,包括:通过爬取社交网络中的用户信息建立用户信息库,所述用户信息携带用户ID;获取用户话单中访问所述社交网络的URL,并从所述URL中提取用户ID;在所述用户信息库中查找提取的用户ID对应的用户信息,并将用户信息与用户话单的移动用户号码簿号码或用户上网账号关联。

【技术特征摘要】
1.一种在社交网络中对用户信息处理的方法,其特征在于,包括:通过爬取社交网络中的用户信息建立用户信息库,所述用户信息携带用户ID;获取用户话单中访问所述社交网络的URL,并从所述URL中提取用户ID;在所述用户信息库中查找提取的用户ID对应的用户信息,并将用户信息与用户话单的移动用户号码簿号码或用户上网账号关联。2.根据权利要求1所述的方法,其特征在于,所述通过爬取社交网络中的用户信息建立用户信息库包括:利用用户的账号和密码登录所述社交网络;爬取所述用户的用户信息并存储在所述用户信息库中;爬取所述用户的关注人的用户信息并将所述关注人的用户信息存储在所述用户信息库中;将所述关注人作为所述用户,重复执行爬取所述用户的关注人的用户信息并将所述关注人的用户信息存储在所述用户信息库中的操作。3.根据权利要求2所述的方法,其特征在于,所述爬取所述用户的关注人的用户信息并将所述关注人的用户信息存储在所述用户信息库中包括:获取所述用户的关注人ID并依次存放在待爬取队列的队尾;爬取待爬取队列的队头的关注人的用户信息并将该关注人的用户信息存储在所述用户信息库中,直至取待爬取队列为空队列。4.根据权利要求2或3所述的方法,其特征在于,在爬取每个用户的用户信息后,将该用户的用户ID存放在已爬取集合中;在爬取所述用户的关注人的用户信息之前,还包括:判断关注人ID是否在已爬取集合中,如果否,则爬取该关注人的用户信息;如果是,则爬取下一个关注人的用户信息。5.根据权利要求2所述的方法,其特征在于,以随机时间间隔爬取所述用户的关注人的用户信息。6.根据权利要求2所述的方法,其特征在于,如果在建立用户信息库的过程中发现登录所述社交网络的所述用户的账号异常,则利用另一个用户的账号和密码重新登录所述社交网络。7.一种在社交网络中对用户信息...

【专利技术属性】
技术研发人员:马怡安
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1