The invention discloses a method and device for identifying interest information, relates to the field of information technology, to solve the \domain name in the domain name condition information corresponding to the label information of the tag system is not complete, the user interest information to identify the low precision problem. The main technical scheme of the invention is: to get the user's page access record information, the page access record information includes information acquisition and page title; corresponding to the page title tag information from the preset information storage location, the preset storage location to save different web page header information corresponding to the tag information; the label configuration information for the user interest information. The invention is mainly used for identifying the interests, interests and concerns of users during Internet marketing.
【技术实现步骤摘要】
本专利技术涉及信息
,尤其涉及一种兴趣信息识别的方法及装置。
技术介绍
随着信息技术的快速发展,用户的兴趣爱好和关注点受到商家越来越多的关注,通过识别用户的兴趣爱好和关注点标签,可以增加互联网营销的精准性。通常,由于互联网用户不会主动填写和提交此类信息,只能通过被动采集互联网用户的行为数据获取用户的兴趣爱好和关注点等兴趣信息信息。其中,用户的行为数据包括用户访问的访问页URL(UniformResourceLocator,URL,即统一资源定位符)、访问页域名、访问页标题等信息。目前,通常通过域名标签系统对用户兴趣信息进行识别。具体是通过从域名标签系统中获取与用户访问的网页域名信息对应的标签信息作为用户兴趣信息。但是,由于域名标签系统中保存的网页域名信息局限性较大,无法对所有网页域名信息进行覆盖,从而造成现有兴趣信息的识别精度较低。
技术实现思路
有鉴于此,本专利技术实施例提供一种兴趣信息的识别方法及装置,主要目的是提高兴趣信息的识别精度。依据本专利技术一个方面,提供了一种兴趣信息的识别方法,包括:获取用户的页面访问记录信息,所述页面访问记录信息包括网页标题信息;从预置存储位置获取与所述网页标题信息对应的标签信息,所述预置存储位置保存有不同网页标题信息分别对应的标签信息;将所述标签信息配置为所述用户的兴趣信息。依据本专利技术一个方面,提供了一种兴趣信息的识别装置,包括:获取单元,用于获取用户的页面访问记录信息,所述页面访问记录信息包括网页标题信息;所述获取单元,还用于从预置存储位置获取与所述网页标题信息对应的标签信息,所述预置存储位置保 ...
【技术保护点】
一种兴趣信息的识别方法,其特征在于,包括:获取用户的页面访问记录信息,所述页面访问记录信息包括网页标题信息;从预置存储位置获取与所述网页标题信息对应的标签信息,所述预置存储位置保存有不同网页标题信息分别对应的标签信息;将所述标签信息配置为所述用户的兴趣信息。
【技术特征摘要】
1.一种兴趣信息的识别方法,其特征在于,包括:获取用户的页面访问记录信息,所述页面访问记录信息包括网页标题信息;从预置存储位置获取与所述网页标题信息对应的标签信息,所述预置存储位置保存有不同网页标题信息分别对应的标签信息;将所述标签信息配置为所述用户的兴趣信息。2.根据权利要求1所述的兴趣信息的识别方法,其特征在于,所述获取用户的页面访问记录信息之前,所述方法还包括:从各个数据源中分别获取对应的网页标题信息;将所述网页标题信息划分为不同类别;为每一类别中的网页标题信息配置与所述类别对应的标签信息;将各个网页标题信息以及与所述各个网页标题信息分别对应的标签信息保存在所述预置存储位置。3.根据权利要求2所述的兴趣信息的识别方法,其特征在于,所述从各个数据源中分别获取对应的网页标题信息之前,所述方法还包括:从所述各个数据源中获取符合预置条件的热点数据源;所述从各个数据源中分别获取对应的网页标题信息包括:从所述热点数据源中分别获取对应的网页标题信息。4.根据权利要求2所述的兴趣信息的识别方法,其特征在于,所述从各个数据源中分别获取对应的网页标题信息包括:按照预设时间间隔从各个数据源中分别获取对应的网页标题信息。5.根据权利要求1所述的兴趣信息的识别方法,其特征在于,所述页面访问记录信息还包括网页域名信息,所述从预置存储位置获取与所述网页标题信息对应的标签信息之前,还包括:判断域名标签系统中是否存在所述网页域名信息对应的标签信息,所述域名标签系统中保存有不同网页域名信息分别对应的标签信息;所述从预置存储位置获取与所述网页标题信息对应的标签信息包括:若不存在,则从所述预置存储位置获取与所述网页标题信息对应的标
\t签信息;若存在,则从所述域名标签系统中获取与所述网页域名信息对应的标签信息。6.一种兴趣信息的识别装置,其特征在于,包括...
【专利技术属性】
技术研发人员:郭琦,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。