一种信息推荐方法及系统技术方案

技术编号:9143185 阅读:149 留言:0更新日期:2013-09-12 04:42
本发明专利技术公开了一种信息推荐方法及系统,其中所述方法包括:采集网址及其对应的标签,所述标签为对网页内容、主题和/或形式进行标注的文本;汇总采集到的数据,以建立数据库,所述数据库中包括网址与标签之间的对应关系以及同一网址在对应的各个标签下的标注分布信息;接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息;根据所述标注分布信息进行标签选择,根据所选中的标签在所述数据库中对应的其他网址,向用户进行网址推荐。通过本发明专利技术,能够扩大方便用户访问的网址的范围,使得一些尚未包含的网址列表中的网址资源也能获得更高的利用率。

【技术实现步骤摘要】
一种信息推荐方法及系统
本专利技术涉及互联网
,特别是涉及一种信息推荐方法及系统。
技术介绍
互联网用户通常会在一段时期内对一些网站有稳定持续的访问需求,而记住网址对一些用户来说是个不小的门槛。尽管一部分站点的网址相对较为简短,但是一旦数量太多,要想全部记住也是一件困难的事情。在此前提下,用户经常会使用浏览器或网站提供的网址列表的功能,例如,收藏夹、或者类似网址导航功能的“快速通道”中的网址列表,等等。这些网址列表通常是允许用户自行建立及维护的,使得用户可以随时将有长期稳定访问需求的页面网址加入网址列表中,这样以后如有访问需求,不需要在浏览器地址栏中输入网址,而是直接在网址列表中寻找到目标并点击即可打开目标网址。虽然网址列表能够使得用户无需记忆具体的网址便可以访问到相应的网页,但是,又会使得用户的相关访问范围受到该网址列表的限制,相应的,也使得网络中存在的一些尚未包含在网址列表中的网址资源无法得到有效的利用。
技术实现思路
本专利技术提供了一种信息推荐方法及系统,能够扩大方便用户访问的网址的范围,使得一些尚未包含的网址列表中的网址资源也能获得更高的利用率。本专利技术提供了如下方案:一种信息推荐方法,包括:采集网址及其对应的标签,所述标签为对网页内容、主题和/或形式进行标注的文本;汇总采集到的数据,以建立数据库,所述数据库中包括网址与标签之间的对应关系以及同一网址在对应的各个标签下的标注分布信息;接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息;根据所述标注分布信息进行标签选择,根据所选中的标签在所述数据库中对应的其他网址,向用户进行网址推荐。可选的,所述同一网址在对应的各个标签下的标注分布信息包括:同一网址在对应的各个标签下的标注比例,其中,某网址在某标签下的标注比例为:在所述采集到的数据中,该网址被标注为该标签的次数与该网址该标注的总次数之比,通过以下方式进行标签选择:根据所述指定网址在对应的各个标签下的标注比例,为所述指定网址选择标签。可选的,所述根据所述指定网址在对应的各个标签下的标注比例,为所述指定网址选择标签包括:按照所述指定网址在对应的各个标签下的标注比例的大小,分别对所述指定网址对应的各个标签进行排序;根据排序的结果,为所述指定网址选择标签。可选的,所述根据所述指定网址在对应的各个标签下的标注比例,为所述指定网址选择标签包括:计算所述指定网址对应的各个标签在该用户的网址列表中的标注权重,其中,对于某标签,通过以下方式计算其在该用户的网址列表中的标注权重:获取该标签在该用户的网址列表中对应的全部网址,根据这些网址分别在该标签下的标注比例及所述这些网址各自在所述数据库中的标注量,计算该标签在该用户的网址列表中的标注权重;根据所述指定网址对应的各个标签在该用户的网址列表中的标注权重,分别对所述指定网址各自对应的各个标签进行排序;根据排序的结果,为所述指定网址选择标签。可选的,当用户的网址列表中包含多个目录时,网址列表中具有同一标签的网址位于同一目录下;所述方法还包括:获取用户的网址列表中的目录信息;如果用户的网址列表中存在某标签对应的目录,则对该标签进行加权调整。可选的,所述指定网址包括用户的网址列表中的网址,所述接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息包括:接收到携带有用户网址列表中的网址的请求时,在所述数据库中分别查询所述请求中携带的各个网址对应的标签以及所述请求中携带的各个网址在对应的各个标签下的标注分布信息。可选的,当用户的网址列表中包含多个目录,网址列表中具有同一标签的网址位于同一目录下时,所述方法还包括:获取用户的网址列表中的目录信息;在所述目录信息中查找与所选中的标签对应的目录;如果查找到,将所述网址列表中的网址整理到所选中的标签对应的目录中;如果未查找到,或者用户的网址列表中不存在目录信息,则在所述用户的网址列表中创建与所选中的标签对应的目录,并将所述网址列表中的网址整理到所述创建的目录中。可选的,所述指定网址包括用户正在向网址列表中添加的网址,所述接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息包括:接收到携带有用户正在向网址列表中添加的网址的请求时,在所述数据库中查询所述请求中携带的网址对应的标签以及所述请求中携带的网址在对应的各个标签下的标注分布信息。可选的,当用户的网址列表中包含多个目录,网址列表中具有同一标签的网址位于同一目录下时所述方法还包括:获取用户的网址列表中的目录信息;在所述目录信息中查找与所选中的标签对应的目录;如果查找到,将所述用户正在向网址列表中添加的网址添加到与所选中的标签对应的目录中;如果未查找到,或者用户的网址列表中不存在目录信息,则在所述用户的网址列表中创建与所选中的标签对应的目录,并将所述用户正在向网址列表中添加的网址添加到所述创建的目录中。可选的,还包括:将所述所选中的标签推荐给用户。可选的,在采集包含网址及其对应的标签的数据时,还包括:采集标签之间的父子关系,并将所有的父子关系进行汇总,组成标签父子链;在根据所选中的标签在所述数据库中对应的其他网址,向用户进行网址推荐时,判断指定网址对应的标签是否处于标签父子链中,如果是,将指定网址对应的标签的子标签加入到推荐网址所依据的标签中进行网址的推荐。还提供了一种信息推荐系统,包括:数据采集单元,用于采集网址及其对应的标签,所述标签为对网页内容、主题和/或形式进行标注的文本;数据库建立单元,用于汇总采集到的数据,以建立数据库,所述数据库中包括网址与标签之间的对应关系以及同一网址在对应的各个标签下的标注分布信息;查询单元,用于在接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息;推荐单元,用于根据所述标注分布信息进行标签选择,根据所选中的标签在所述数据库中对应的其他网址,向用户进行网址推荐。可选的,所述同一网址在对应的各个标签下的标注分布信息包括:同一网址在对应的各个标签下的标注比例,其中,某网址在某标签下的标注比例为:在所述采集到的数据中,该网址被标注为该标签的次数与该网址该标注的总次数之比,通过以下单元进行标签选择:标签选择单元,用于根据所述指定网址在对应的各个标签下的标注比例,为所述指定网址选择标签。可选的,所述标签选择单元包括:第一排序子单元,用于按照所述指定网址在对应的各个标签下的标注比例的大小,分别对所述指定网址对应的各个标签进行排序;第一选择子单元,用于根据排序的结果,为所述指定网址选择标签。可选的,所述标签选择单元包括:权重计算子单元,用于计算所述指定网址对应的各个标签在该用户的网址列表中的标注权重,其中,对于某标签,通过以下方式计算其在该用户的网址列表中的标注权重:获取该标签在该用户的网址列表中对应的全部网址,根据这些网址分别在该标签下的标注比例及所述这些网址各自在所述数据库中的标注量,计算该标签在该用户的网址列表中的标注权重;第二排序子单元,用于根据所述指定网址对应本文档来自技高网...
一种信息推荐方法及系统

【技术保护点】
一种信息推荐方法,其特征在于,包括:采集网址及其对应的标签,所述标签为对网页内容、主题和/或形式进行标注的文本;汇总采集到的数据,以建立数据库,所述数据库中包括网址与标签之间的对应关系以及同一网址在对应的各个标签下的标注分布信息;接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息;根据所述标注分布信息进行标签选择,根据所选中的标签在所述数据库中对应的其他网址,向用户进行网址推荐。

【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:采集网址及其对应的标签,所述标签为对网页内容、主题和/或形式进行标注的文本;汇总采集到的数据,以建立数据库,所述数据库中包括网址与标签之间的对应关系以及同一网址在对应的各个标签下的标注分布信息,其中,所述同一网址在对应的各个标签下的标注分布信息包括:同一网址在对应的各个标签下的标注比例;接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息;根据所述标注分布信息进行标签选择,根据所选中的标签在所述数据库中对应的其他网址,向用户进行网址推荐。2.根据权利要求1所述的方法,其特征在于,某网址在某标签下的标注比例为:在所述采集到的数据中,该网址被标注为该标签的次数与该网址该标注的总次数之比,通过以下方式进行标签选择:根据所述指定网址在对应的各个标签下的标注比例,为所述指定网址选择标签。3.根据权利要求2所述的方法,其特征在于,所述根据所述指定网址在对应的各个标签下的标注比例,为所述指定网址选择标签包括:按照所述指定网址在对应的各个标签下的标注比例的大小,分别对所述指定网址对应的各个标签进行排序;根据排序的结果,为所述指定网址选择标签。4.根据权利要求2所述的方法,其特征在于,所述根据所述指定网址在对应的各个标签下的标注比例,为所述指定网址选择标签包括:计算所述指定网址对应的各个标签在该用户的网址列表中的标注权重,其中,对于某标签,通过以下方式计算其在该用户的网址列表中的标注权重:获取该标签在该用户的网址列表中对应的全部网址,根据这些网址分别在该标签下的标注比例及所述这些网址各自在所述数据库中的标注量,计算该标签在该用户的网址列表中的标注权重;根据所述指定网址对应的各个标签在该用户的网址列表中的标注权重,分别对所述指定网址各自对应的各个标签进行排序;根据排序的结果,为所述指定网址选择标签。5.根据权利要求3或4所述的方法,其特征在于,当用户的网址列表中包含多个目录时,网址列表中具有同一标签的网址位于同一目录下;所述方法还包括:获取用户的网址列表中的目录信息;如果用户的网址列表中存在某标签对应的目录,则对该标签进行加权调整。6.根据权利要求1至4任一项所述的方法,其特征在于,所述指定网址包括用户的网址列表中的网址,所述接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息包括:接收到携带有用户网址列表中的网址的请求时,在所述数据库中分别查询所述请求中携带的各个网址对应的标签以及所述请求中携带的各个网址在对应的各个标签下的标注分布信息。7.根据权利要求6所述的方法,其特征在于,当用户的网址列表中包含多个目录,网址列表中具有同一标签的网址位于同一目录下时,所述方法还包括:获取用户的网址列表中的目录信息;在所述目录信息中查找与所选中的标签对应的目录;如果查找到,将所述网址列表中的网址整理到所选中的标签对应的目录中;如果未查找到,或者用户的网址列表中不存在目录信息,则在所述用户的网址列表中创建与所选中的标签对应的目录,并将所述网址列表中的网址整理到所述创建的目录中。8.根据权利要求1至4任一项所述的方法,其特征在于,所述指定网址包括用户正在向网址列表中添加的网址,所述接收到为指定网址进行信息推荐的请求时,在所述数据库中查询所述指定网址对应的标签以及所述指定网址在对应的各个标签下的标注分布信息包括:接收到携带有用户正在向网址列表中添加的网址的请求时,在所述数据库中查询所述请求中携带的网址对应的标签以及所述请求中携带的网址在对应的各个标签下的标注分布信息。9.根据权利要求8所述的方法,其特征在于,当用户的网址列表中包含多个目录,网址列表中具有同一标签的网址位于同一目录下时所述方法还包括:获取用户的网址列表中的目录信息;在所述目录信息中查找与所选中的标签对应的目录;如果查找到,将所述用户正在向网址列表中添加的网址添加到与所选中的标签对应的目录中;如果未查找到,或者用户的网址列表中不存在目录信息,则在所述用户的网址列表中创建与所选中的标签对应的目录,并将所述用户正在向网址列表中添加的网址添加到所述创建的目录中。10.根据权利要求1至4任一项所述的方法,其特征在于,还包括:将所述所选中的标签推荐给用户。11.根据权利要求1所述的方法,其特征在于,在采集包含网址及其对应的标签的数据时,还包括:采集标签之间的父子关系,并将所有的父子关系进行汇总,组成标签父子链;在根据所选中的标签在所述数据库中对应的其他网址,向用户进行网址推荐时,判断指定网址对应的标签是否处于标签父子链中,如果是,将指定网址对应的标签的子标签加入到推荐网址所依据的标签中进行网址的推荐。12.一种信息推荐系统,其特征在于,包括:数据采集单元,用于采集网址及其对应的标签,所...

【专利技术属性】
技术研发人员:徐俊王砚峰崔华
申请(专利权)人:北京搜狗信息服务有限公司北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1