一种社交图谱构建方法技术

技术编号:16589702 阅读:33 留言:0更新日期:2017-11-18 17:59
本发明专利技术涉及社交网络,旨在提供一种社交图谱构建方法。该种社交图谱构建方法包括下述步骤:社交网络服务库构建、信息录入、信息探测、信息抓取、信息分析、用户确认。本发明专利技术能充分利用社交网络的开放性,自动构建互联网社交服务库;本发明专利技术能充分利用社交网络的互动性,可以不受限制的探测用户信息;随着发现的深入,用户可以回顾自己整个网络社交历程。

A social graph construction method

The present invention relates to social networks, and aims to provide a social graph construction method. This social graph construction method includes the following steps: social network service library construction, information input, information detection, information capture, information analysis, user confirmation. The invention can make full use of the opening of the social network, the automatic construction of Internet social service base; the invention can make full use of interactive social network, can detect the user information is not restricted; with the discovery of deep, users can review their entire social networking course.

【技术实现步骤摘要】
一种社交图谱构建方法
本专利技术是关于社交网络领域,特别涉及一种社交图谱构建方法。
技术介绍
当今这个年代互联网已经非常普及,覆盖了人们生活中的方方面面,人们也开始在网络上进行社交活动,随着网络社交的悄悄演进,一个人在网络上的形象更加趋于完整,这时候社交网络出现了。网络社交已有几十年的发展史,互联网用户在整个发展过程中积累了很多社交身份,所有的这些身份可以描述出这个用户完整的互联网生命历程。现今我们进行网络社交都需要有提供社交服务的网站或者服务的账号,这些账号都需要绑定一些个人信息作为用户的身份标识,比如名称、手机、邮箱等。网络社交最吸引人的就是其虚拟性,可以不暴露自己真实身份的情况下享受社交的自由。当资料泄露或者身份暴露影响社交体验时,人们往往会修改账户信息或者遗弃该社交账户。另一方面,一项社交服务往往是有单一性的,而且人们的社交行为往往是不持续的,用户很少会停留在一款社交产品上。用户在停止使用一段时间后再次使用这项社交服务时,有可能会因为遗忘账户信息或者身份凭证(手机、邮箱)更换导致无法继续使用服务。因此,研究出构建社交图谱的方法,使其能通过社交网络把任意一个互联网用户的众多社交身份关联起来,市场前景看好。
技术实现思路
本专利技术的主要目的在于克服现有技术中的不足,提供一种能帮助用户构建自己整个互联网生命周期内所有的社交身份信息,形成完整的社交图谱的方法。为解决上述技术问题,本专利技术的解决方案是:提供一种社交图谱构建方法,用于构建用户的完整社交图谱,所述社交图谱构建方法具体包括下述步骤:(1)社交网络服务库构建:收集互联网上(所有)的社交网络服务,构建社交网络服务库并定期更新;(2)信息录入:用户主动向发现引擎录入已知的社交身份信息,社交身份信息包括社交服务提供者、账户信息;所述发现引擎是指用于实现步骤(3)的信息探测、步骤(4)的信息抓取、步骤(5)的信息分析的程序;(3)信息探测:通过社交网络服务提供的开放接口或者发现引擎模拟账户结合用户录入的信息进行探测,用于确认目标用户是否存在于该社交网络服务中(例如通过查找用户或者添加好友的方式确认用户是否存在于该社交服务);(4)信息抓取:抓取用户在社交服务上所有的信息,包括名称、邮箱、手机、位置信息、时间信息,并将这些信息存入发现引擎数据库中;(5)信息分析:分析步骤(4)中抓取到的用户社交内容,通过关联分析算法分析获取到的信息之间的关系形成社交图谱;(6)用户确认:用户观察分析出来的社交图谱和步骤(4)中抓取到的用户社交内容,确认抓取和分析后的内容是否为自己所有,当用户确认信息与自己相关,则将这些信息录入到发现引擎(步骤(2)),并通过发现引擎的定时任务调度(发现引擎的定时任务调度模块)触发下一次信息获取和分析循环(循环是指从步骤(2)到步骤(5))。在本专利技术中,所述步骤(1)中,社交网络服务库利用认证协议(互联网中合作站点之间常常用OAuth协议来实现账户互通),自动发现互联网上的社交服务来实现构建,具体包括下述步骤:步骤(1A):选取一批支持统一认证协议(公开的统一认证协议均可支持)的社交服务作为构建起点;步骤(1B):通过发现引擎(发现引擎中的模拟网站注册模块)向这些社交服务模拟注册一个账户;步骤(1C):通过社交服务提供的统一认证服务登录到合作站点(即统一认证支持的目标站点);步骤(1D):检查合作站点的统一认证服务,将其合作站点中未存入发现引擎数据库的站点存入发现引擎数据库;步骤(1E):当步骤(1D)有新的合作站点存入发现引擎数据库时,通过发现引擎的定时任务调度(发现引擎的定时任务调度模块)重复上述4个步骤。在本专利技术中,所述步骤(2)的信息录入过程中,用户录入的社交身份信息为社交服务完整的用户信息,包括用户名、密码,用于丰富分析内容获取的途径和内容数量。在本专利技术中,所述步骤(3)的信息探测过程,具体包括下述步骤:步骤(3A):模拟用户登录:(通过代码)调用社交网络服务提供的接口,模拟用户登录社交网络服务;步骤(3B):模拟用户查询:(通过代码)调用社交网络服务提供的用户查询接口查询指定用户信息;步骤(3C):分析查询结果:通过步骤(3B)调用社交网络服务的用户查询接口的返回结果,确认用户是否存在于该社交网络服务中。在本专利技术中,所述步骤(5)的信息分析,具体包括下述步骤:步骤(5A):社交身份收集:从爬取到的内容中提取所有的社交身份信息,包括用户名、昵称、手机、邮箱、头像,用于分析备用;步骤(5B):互动对象搜集:通过社交网络的点名方式“@”获取用户的互动对象,用于分析关系网络;步骤(5C):地理位置信息收集:搜集地理信息,用于账户归属的有效性判断(例如用户从未到过浙江,但是微信软件显示这条微信的定位信息是杭州);步骤(5D):时间信息搜集:搜集时间信息,用于账户归属的有效性判断(例如社交网络账号的注册时间是2000年,但是2000用户并未开始网络社交活动);步骤(5E):社交内容提取:提取社交内容,利用社交内容中发现的社交服务构建社交网络服务库(例如在微博中的社交内容中包含“加我微信abcd”,即可初步判定用户拥有微信,并将微信账号通过步骤(2)录入发现引擎);步骤(5F):信息关联:通过上述信息进行互联,形成社交图谱并发现孤岛信息,协助用户确认信息是否有效。在本专利技术中,在信息分析中,通过身份凭证(用户名、邮箱、手机号)确认用户身份,通过凭证的时间信息和地理位置信息确认用户身份,通过社交互动对象身份凭证(用户名、邮箱、手机)确认用户身份,通过社交内容提取出新的社交服务。本专利技术的工作原理:通过互联网认证协议自动构建社交网络服务库,获取所有相互关联的社交服务,根据社交服务构建和扩大信息获取途径和范围;信息分析模块依赖于社交内容的连贯性形成跨越时间、地域以及社交内容分类的图谱。与现有技术相比,本专利技术的有益效果是:本专利技术能充分利用社交网络的开放性,自动构建互联网社交服务库;本专利技术能充分利用社交网络的互动性,可以不受限制的探测用户信息;随着发现的深入,用户可以回顾自己整个网络社交历程。本专利技术的社交服务库是可以自动扩充的,数据分析维度也可以不断扩充。利用本专利技术,用户可以发现遗失的社交身份,用户可以发现已失效的身份凭证,用户主动更换凭证时可以明确的知道该凭证涉及到哪些社交服务。附图说明图1为本专利技术的流程图。具体实施方式首先需要说明的是,本专利技术涉及存储、爬虫等软件技术的应用,是计算机技术在互联网领域的一种应用。在本专利技术的实现过程中,会涉及到多个软件功能模块的应用。申请人认为,如在仔细阅读申请文件、准确理解本专利技术的实现原理和专利技术目的以后,在结合现有公知技术的情况下,本领域技术人员完全可以运用其掌握的软件编程技能实现本专利技术。凡本专利技术申请文件提及的均属此范畴,申请人不再一一列举。下面结合附图与具体实施方式对本专利技术作进一步详细描述:如图1所示的一种社交图谱构建方法,基于网络信息探测和分析的发现引擎,帮助用户构建自己整个互联网生命周期内所有的社交身份信息,形成完整的社交图谱,用户在更换身份凭证时可明确知道涉及到哪些社交服务,避免因身份凭证更换而导致的社交服务账户无法使用的问题。所述社交图谱构建方法具体包括下述步骤:(1)社交网络服务库构建:收集互联网上所有的社本文档来自技高网...
一种社交图谱构建方法

【技术保护点】
一种社交图谱构建方法,用于构建用户的完整社交图谱,其特征在于,所述社交图谱构建方法具体包括下述步骤:(1)社交网络服务库构建:收集互联网上的社交网络服务,构建社交网络服务库并定期更新;(2)信息录入:用户主动向发现引擎录入已知的社交身份信息,社交身份信息包括社交服务提供者、账户信息;所述发现引擎是指用于实现步骤(3)的信息探测、步骤(4)的信息抓取、步骤(5)的信息分析的程序;(3)信息探测:通过社交网络服务提供的开放接口或者发现引擎模拟账户结合用户录入的信息进行探测,用于确认目标用户是否存在于该社交网络服务中;(4)信息抓取:抓取用户在社交服务上所有的信息,包括名称、邮箱、手机、位置信息、时间信息,并将这些信息存入发现引擎数据库中;(5)信息分析:分析步骤(4)中抓取到的用户社交内容,通过关联分析算法分析获取到的信息之间的关系形成社交图谱;(6)用户确认:用户观察分析出来的社交图谱和步骤(4)中抓取到的用户社交内容,确认抓取和分析后的内容是否为自己所有,当用户确认信息与自己相关,则将这些信息录入到发现引擎,并通过发现引擎的定时任务调度触发下一次信息获取和分析循环。

【技术特征摘要】
1.一种社交图谱构建方法,用于构建用户的完整社交图谱,其特征在于,所述社交图谱构建方法具体包括下述步骤:(1)社交网络服务库构建:收集互联网上的社交网络服务,构建社交网络服务库并定期更新;(2)信息录入:用户主动向发现引擎录入已知的社交身份信息,社交身份信息包括社交服务提供者、账户信息;所述发现引擎是指用于实现步骤(3)的信息探测、步骤(4)的信息抓取、步骤(5)的信息分析的程序;(3)信息探测:通过社交网络服务提供的开放接口或者发现引擎模拟账户结合用户录入的信息进行探测,用于确认目标用户是否存在于该社交网络服务中;(4)信息抓取:抓取用户在社交服务上所有的信息,包括名称、邮箱、手机、位置信息、时间信息,并将这些信息存入发现引擎数据库中;(5)信息分析:分析步骤(4)中抓取到的用户社交内容,通过关联分析算法分析获取到的信息之间的关系形成社交图谱;(6)用户确认:用户观察分析出来的社交图谱和步骤(4)中抓取到的用户社交内容,确认抓取和分析后的内容是否为自己所有,当用户确认信息与自己相关,则将这些信息录入到发现引擎,并通过发现引擎的定时任务调度触发下一次信息获取和分析循环。2.根据权利要求1所述的一种社交图谱构建方法,其特征在于,所述步骤(1)中,社交网络服务库利用认证协议,自动发现互联网上的社交服务来实现构建,具体包括下述步骤:步骤(1A):选取一批支持统一认证协议的社交服务作为构建起点;步骤(1B):通过发现引擎向这些社交服务模拟注册一个账户;步骤(1C):通过社交服务提供的统一认证服务登录到合作站点;步骤(1D):检查合作站点的统一认证服务,将其合作站点中未存入发现引擎数据库的站点存入发现引擎数据库;步骤(1E):当步骤(1D)有新的合作站点存入发现引擎数据库时...

【专利技术属性】
技术研发人员:潘国华范渊黄进
申请(专利权)人:杭州安恒信息技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1