识别用户兴趣的方法及装置制造方法及图纸

技术编号:14172125 阅读:67 留言:0更新日期:2016-12-12 23:57
本发明专利技术公开了一种识别用户兴趣的方法及装置,涉及互联网技术领域,能够解决现有技术中识别用户兴趣的准确度以及完善度都较低的问题。本发明专利技术的方法主要包括:获取网站列表以及待查询的用户身份标识号码ID;携带所述用户ID向所述网站列表中各个网站的网站服务器发送注册请求;接收所述各个网站服务器根据所述注册请求返回的注册响应;通过接收到的注册响应确定所述网站列表中所述用户ID已注册的网站;根据所述用户ID已注册的网站的网站类型,确定所述用户ID的兴趣。本发明专利技术主要应用于通过识别用户兴趣向用户推荐相关信息的场景中。

Method and apparatus for identifying user interest

The invention discloses a method and a device for identifying the user interest, which relates to the technical field of the Internet, and can solve the problems of low accuracy and low accuracy of identifying the user's interest in the prior art. The method of the invention mainly comprises: acquiring website list and query the user identification number ID; carrying the user ID request to the web server to send each registered website the website in the list; receiving the individual web server according to the registration request return registration response; received through the registration response determined the user ID has been registered in the list of Web sites; the user according to the registered ID website, determine the user interest ID. The invention is mainly applied to a scene in which users can identify relevant information by identifying user interest.

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种识别用户兴趣的方法及装置
技术介绍
随着互联网的高速发展,越来越多的人通过网络搜索自己所需的信息。然而,随着网络资源更新速度的加快,人们从大量资源中获取自己所需信息的效率却越来越低。为了提高用户搜索信息(包括站内搜索和浏览器搜索)的效率,现有的解决方案主要有两种:(1)对各个网站(或者网页)的搜索热度进行统计,将热度较高的网站推荐给各个用户。(2)对用户的历史浏览行为进行分析,将用户浏览频率较高的网站推荐给对应的用户。虽然上述两种方案在一定程度上能够为用户提供一些其感兴趣的内容,但是在某些情况下,准确度却不高。例如,热度较高的网站不一定是当前用户所感兴趣的网站。又如,对于站内搜索而言,当用户使用的应用或者登录的网站所涉及的内容比较单一时(例如仅涉及社交内容的社交网站),利用用户的历史浏览行为仅能向该用户推荐与当前网站内容相似的其他网站,而无法向其推荐其他类型的网站。再如,当用户使用某应用或者某网站的时间较短时,浏览记录较少,从而仅根据用户历史浏览行为无法准确确定用户的兴趣,并且即使能够准确确定用户的某种兴趣,也无法确定用户的其他兴趣。因此,如何在提高识别用户兴趣准确度的基础上,尽可能多地确定用户的兴趣是当今一大难题。
技术实现思路
有鉴于此,本专利技术提供一种识别用户兴趣的方法及装置,能够解决现有技术中识别用户兴趣的准确度以及完善度都较低的问题。一方面,本专利技术提供了一种识别用户兴趣的方法,所述方法包括:获取网站列表以及待查询的用户身份标识号码ID;携带所述用户ID向所述网站列表中各个网站的网站服务器发送注册请求;接收各个网站服务器根据所述注册请求返回的注册响应;通过接收到的注册响应确定所述网站列表中所述用户ID已注册的网站;根据所述用户ID已注册的网站的网站类型,确定所述用户ID的兴趣。另一方面,本专利技术提供了一种识别用户兴趣的装置,所述装置包括:获取单元,用于获取网站列表以及待查询的用户身份标识号码ID;发送单元,用于携带所述获取单元获得的所述用户ID向所述网站列表中各个网站的网站服务器发送注册请求;接收单元,用于接收各个网站服务器根据所述注册请求返回的注册响应;第一确定单元,用于通过所述接收单元接收到的注册响应确定所述网站列表中所述用户ID已注册的网站;第二确定单元,用于根据所述第一确定单元确定的所述用户ID已注册的网站的网站类型,确定所述用户ID的兴趣。借由上述技术方案,本专利技术提供的识别用户兴趣的方法及装置,能够在获取网站列表以及待查询的用户ID后,携带该用户ID向该网站列表中各个网站的网站服务器发送注册请求,并且在接收到各个网站服务器根据注册请求返回的注册响应后,根据这些注册响应,确定网站列表中该用户ID已经注册的网站,最后能够根据用户ID已注册的网站的网站类型,来确定用户ID的兴趣。由于用户注册的网站往往为用户感兴趣的网站,并且本专利技术在确定用户ID已注册的网站时并不涉及用户的历史浏览行为,所以通过查询某用户ID已注册的所有网站所确定的兴趣,不但准确度比现有技术高,而且当历史浏览行为较少或者比较单一时,也能够尽可能多的确定用户的兴趣,从而使确定的兴趣更加完善,进而可以更有效地为用户提供其所需的信息。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种识别用户兴趣的方法的流程图;图2示出了本专利技术实施例提供的另一种识别用户兴趣的方法的流程图;图3示出了本专利技术实施例提供的一种查询用户已注册网站的示意图;图4示出了本专利技术实施例提供的另一种查询用户已注册网站的示意图;图5示出了本专利技术实施例提供的一种识别用户兴趣的装置的组成框图;图6示出了本专利技术实施例提供的另一种识别用户兴趣的装置的组成框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例提供了一种识别用户兴趣的方法,如图1所示,该方法主要包括:101、获取网站列表以及待查询的用户ID。其中,网站列表包括网站域名以及对应的网站模板,网站模板用于描述网站注册页面的布局;用户ID(Identity,身份标识号码)为能够注册网站的账户名称,主要包括用户名、手机号以及邮箱。在实际应用中,用户兴趣识别服务器可以采用网络爬虫的方式爬取互联网上产生的各个网页,并对各个网页的网址进行分析,从中确定互联网上涉及的网站。此外,用户兴趣识别服务器还可以对获得的各个网站的注册页面进行采集,并对注册页面的页面布局进行分析,确定对应网站的网站模板,以便后续根据网站模板快速提取用于确定待用户ID是否注册相应网站的字段。其中,用户兴趣识别服务器可以实时或者定时对网站列表进行更新。102、携带所述用户ID向所述网站列表中各个网站的网站服务器发送注册请求。其中,由于各个网站规定的协议可能不同,所以用户兴趣识别服务器可以对用户终端向各个网站服务器发送的数据包进行采集,并对这些数据包进行分析,从中确定对应网站所需的传输协议,然后保存在网站列表中。因此,用户兴趣识别服务器向各个网站服务器发送注册请求时,可以根据网站列表中对应网站的传输协议生成注册请求数据包,并将基于该传输协议向对应的网站服务器发送注册请求数据包。103、接收各个网站服务器根据所述注册请求返回的注册响应。当各个网站服务器接收到用户兴趣识别服务器发送的注册请求后,可以针对注册请求中用户ID进行格式验证以及重复验证,从而确定该用户ID是否符合账号注册规则以及确定该用户ID是否为已注册的用户ID,并将确定结果后的网页(即注册响应)返回给用户兴趣识别服务器,以便用户兴趣识别服务器对各个注册响应进行解析,从而判断用户ID是否已注册对应的网站。104、通过接收到的注册响应确定所述网站列表中所述用户ID已注册的网站。当用户兴趣识别服务器接收到各个网站服务器返回的注册响应后,可以分别对各个注册响应中的内容进行解析,从中提取用于判断该用户ID是否已注册对应网站的预设字段,并根据预设字段中的内容确定该用户ID对应的已注册网站。105、根据所述用户ID已注册的网站的网站类型,确定所述用户ID的兴趣。当获得网站列表中该用户ID已注册的所有网站后,可以根据预设划分规则,对获得的各个网站进行分类,确定各个网站的网站类型,并根据网站类型确定用户的兴趣。例如,若用户注册的网站中包含购物网站、社交网站、旅游网站,则用户兴趣识别服务器可以确定该用户对购物、社交以及旅游比较感兴趣。需要说明的是,根据网站类型不仅能够确定用户的兴趣,还能够确定其他内容。例如,若用户已注册的网站中包括地方门户网站,则还可以根据该本文档来自技高网...
识别用户兴趣的方法及装置

【技术保护点】
一种识别用户兴趣的方法,其特征在于,所述方法包括:获取网站列表以及待查询的用户身份标识号码ID;携带所述用户ID向所述网站列表中各个网站的网站服务器发送注册请求;接收各个网站服务器根据所述注册请求返回的注册响应;通过接收到的注册响应确定所述网站列表中所述用户ID已注册的网站;根据所述用户ID已注册的网站的网站类型,确定所述用户ID的兴趣。

【技术特征摘要】
1.一种识别用户兴趣的方法,其特征在于,所述方法包括:获取网站列表以及待查询的用户身份标识号码ID;携带所述用户ID向所述网站列表中各个网站的网站服务器发送注册请求;接收各个网站服务器根据所述注册请求返回的注册响应;通过接收到的注册响应确定所述网站列表中所述用户ID已注册的网站;根据所述用户ID已注册的网站的网站类型,确定所述用户ID的兴趣。2.根据权利要求1所述的方法,其特征在于,通过接收到的注册响应确定所述网站列表中所述用户ID已注册的网站包括:根据所述网站列表中各个网站的网站模板,对对应的注册响应进行解析,所述网站模板用于描述网站注册页面的布局;从所述注册响应中提取预设字段,所述预设字段用于描述所述用户ID是否已注册对应网站或者用于描述所述用户ID不符合账号的注册规则;根据所述预设字段中的内容,确定所述用户ID是否已注册所述注册响应对应的网站。3.根据权利要求1所述的方法,其特征在于,获取待查询的用户身份标识号码ID包括:从当前登录的网站的用户注册信息中获取用户ID;或者,获取输入的用户ID。4.根据权利要求3所述的方法,其特征在于,在通过接收到的注册响应确定所述网站列表中所述用户ID已注册的网站之后,所述方法还包括:向终端发送所述用户ID已注册的网站,以便所述终端显示所述用户ID已注册的网站。5.根据权利要求4所述的方法,其特征在于,若输入至少两个用户ID,则在通过接收到的注册响应确定所述网站列表中所述用户ID已注册的网站之后,所述方法还包括:向所述终端发送所述至少两个用户ID已注册的相同网站,以便所述终端显示所述相同网站。6.根据权利要求1所述的方法,其特征在于,在确定所述用户ID的兴趣之后,所述方法还包括:根据所述用...

【专利技术属性】
技术研发人员:韩作杰魏自立
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1