网址导航的方法、装置及系统制造方法及图纸

技术编号:8323553 阅读:238 留言:0更新日期:2013-02-14 01:22
本发明专利技术公开了网址导航的方法、装置及系统,其中,所述方法包括:获取多台基于客户端设备的访问事件的历史行为数据;根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息;根据所述类别信息确定在网址导航页面中显示的网址类别。通过本发明专利技术,解决了现有的导航服务技术下实现的导航页面内容不能满足互联网用户的浏览需求的问题,取得了使导航页面的内容更加符合互联网用户的需要的有益效果。

【技术实现步骤摘要】

本专利技术涉及浏览器
,具体涉及网址导航的方法、装置及系统
技术介绍
随着计算机技术的发展和互联网用户规模的不断扩大,越来越多的互联网用户使用个人计算机通过互联网获得各种各样所需的信息。同时,为互联网用户提供信息服务的网站也越来越多,互联网网页的数量每天都在以惊人的速度增长,互联网信息呈现出爆发式的增长。对于用户来说,经常需要通过一定的手段,才能在浩如烟海的互联网信息中迅速定位最适合自己需求的网站或者需要的信息,比如通过网址导航服务。网址导航是一个集合较多网址,并按一定条件进行分类的一种网址站,主要为用户提供网址导航服务。网址导航可以使用户不用记忆网站的网址,就能通过网址导航页面提供的链接方便找到自己需要的网站进行浏览和信息检索。同时,现有的网址导航有的还提供了一些比较实用的功能,如号码查询、邮箱登陆、热点新闻、搜索引擎入口等,在一定程度上也为用户的互联网冲浪提供了便利。据统计,目前有相当比例的互联网用户将浏览器的主页设置为网址导航页面,从一个侧面也说明了网址导航服务在实际应用中确实有着方便用户浏览的作用,从而受到了许多用户的欢迎。然而,在现有的网址导航服务技术中,导航内容页面大多是由网址导航产品的运营维护人员人工推荐的静态页面,虽然页面内容内的导航网址可能涉及到许多门类,但相对于互联网上数量巨大并且高速增长的信息量,网址导航内容往往不能够适应互联网用户的浏览需求。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的网址导航的方法,装置和相应的网址导航的系统。依据本专利技术的一个方面,提供了一种网址导航的方法,包括获取多台基于客户端设备的访问事件的历史行为数据;根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息;根据所述类别信息确定在网址导航页面中显示的网址类别。可选地,所述根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,包括从所述历史行为数据中提取特征词;对所述特征词进行聚类,获得多个特征词类别,保存所述多个特征词类别,得到所述群体兴趣模型。可选地,所述群体兴趣模型中还保存有各个类别的权重,所述权重用于体现客户端设备访问方群体对各个类别的感兴趣程度,所述根据所述类别信息确定在网址导航页面中显示的网址类别包括根据各个类别的权重对各个类别进行排序,根据排序结果确定在网址导航页面中显示的网址类别及排列顺序。可选地,所述根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,包括从所述历史行为数据中提取特征词,并获取各个特征词的出现频度;对所述特征词进行聚类,获得多个特征词类别;根据各个类别下的各个特征词的出现频度,获得各个类别的权重;保存所述多个特征词类别以及各自的权重,得到所述群体兴趣模型。可选地,所述类别包括一级类别以及二级类别,每个一级类别下包括多个二级类别,所述保存所述多个特征词类别以及各自的权重包括以二维矩阵的形式保存各个二级类别的权重,其中,所述二维矩阵中的每一行对应每一一级分类下的各个二级类别;所述根据各个类别的权重对各个类别进行排序包括分别将所述二维矩阵中每一行的各个二级类别的权重相加,得到各个一级类别的权重;根据各个一级类别的权重对各个一级类别进行排序,并根据一级类别下各个二级类别的权重,对各个二级类别进行排序。可选地,所述根据各个类别下的各个特征词的出现频度,获得各个类别的权重包括分别对各个类别下的各个特征词的出现频度进行累加,得到各个类别的权重。可选地,所述根据各个类别下的各个特征词的出现频度,获得各个类别的权重包括根据搜索引擎服务器统计的特征词热点信息,获取各个特征词的热点程度信息;根据各个特征词的出现频度以及所述热点程度信息计算各个特征词的综合频度信息;分别对各个类别下的各个特征词的综合频度信息进行累加,得到各个类别的权重。可选地,所述根据各个特征词的出现频度以及所述热点程度信息计算各个特征词的综合频度信息包括将特征词的热点程度信息乘以一加权系数,并与所述出现频度进行相加,得到特征词的综合频度信息;其中,所述加权系数小于I。可选地,所述对所述特征词进行聚类,获得多个特征词类别包括对所述特征词进行归一化处理;对归一化处理后的特征词进行聚类,获得多个特征词类别。可选地,所述从所述历史行为数据中提取特征词包括将在搜索引擎中输入的搜索关键词作为所述特征词;或者,从被访问网页中提取内容关键词作为所述特征词。6根据本专利技术的另一方面,提供了一种网址导航的装置,包括数据获取单元,用于获取多台基于客户端设备的访问事件的历史行为数据;建立模型单元,用于根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息;确定类别单元,用于根据所述类别信息确定在网址导航页面中显示的网址类别。可选地,所述建立模型单元,包括特征词提取子单元,用于从所述历史行为数据中提取特征词;第一建立模型子单元,用于对所述特征词进行聚类,获得多个特征词类别,保存所述多个特征词类别,得到所述群体兴趣模型。可选地,所述群体兴趣模型中还保存有各个类别的权重,所述权重用于体现客户端设备访问方群体对各个类别的感兴趣程度,所述确定类别单元包括第一确定类别子单元,用于根据各个类别的权重对各个类别进行排序,根据排序结果确定在网址导航页面中显示的网址类别及排列顺序。可选地,所述建立模型单元,包括频度获取子单元,用于从所述历史行为数据中提取特征词,并获取各个特征词的出现频度;聚类子单元,用于对所述特征词进行聚类,获得多个特征词类别;类别权重获取子单元,用于根据各个类别下的各个特征词的出现频度,获得各个类别的权重;第二建立模型子单元,用于保存所述多个特征词类别以及各自的权重,得到所述群体兴趣模型。可选地,所述类别包括一级类别以及二级类别,每个一级类别下包括多个二级类别,所述第二建立模型子单元包括权重保存子单元,用于以二维矩阵的形式保存各个二级类别的权重,其中,所述二维矩阵中的每一行对应每一一级分类下的各个二级类别;所述第一确定类别子单元包括—级类别权重获取子单元,用于分别将所述二维矩阵中每一行的各个二级类别的权重相加,得到各个一级类别的权重;排序子单元,用于根据各个一级类别的权重对各个一级类别进行排序,并根据一级类别下各个二级类别的权重,对各个二级类别进行排序。可选地,所述类别权重获取子单元包括第一类别权重获取子单元,用于分别对各个类别下的各个特征词的出现频度进行累加,得到各个类别的权重。可选地,所述类别权重获取子单元包括热点信息获取子单元,用于根据搜索引擎服务器统计的特征词热点信息,获取各个特征词的热点程度信息;综合频度信息获取子单元,用于根据各个特征词的出现频度以及所述热点程度信息计算各个特征词的综合频度信息;第二类别权重获取子单元,用于分别对各个类别下的各个特征词的综合频度信息进行累加,得到各个类别的权重。可选地,所述综合频度信息获取子单元具体用于将特征词的热点程度信息乘以一加权系数,并与所述出现频度进行相加,得到特征词的综合频度信息;其中,所述加权系数小于I。可选地,通过以下子单元对所述特征词进行聚类,获得多个特征词类别归一化处理子单元,用于对所述特征词本文档来自技高网...

【技术保护点】
一种网址导航的方法,包括:获取多台基于客户端设备的访问事件的历史行为数据;根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息;根据所述类别信息确定在网址导航页面中显示的网址类别。

【技术特征摘要】
1.一种网址导航的方法,包括 获取多台基于客户端设备的访问事件的历史行为数据; 根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息; 根据所述类别信息确定在网址导航页面中显示的网址类别。2.如权利要求I所述的方法,所述根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,包括 从所述历史行为数据中提取特征词; 对所述特征词进行聚类,获得多个特征词类别,保存所述多个特征词类别,得到所述群体兴趣I吴型。3.如权利要求I所述的方法,所述群体兴趣模型中还保存有各个类别的权重,所述权重用于体现客户端设备访问方群体对各个类别的感兴趣程度,所述根据所述类别信息确定在网址导航页面中显示的网址类别包括 根据各个类别的权重对各个类别进行排序,根据排序结果确定在网址导航页面中显示的网址类别及排列顺页序。4.如权利要求3所述的方法,所述根据所述历史行为数据建立客户端设备访问方的群体兴趣I吴型,包括 从所述历史行为数据中提取特征词,并获取各个特征词的出现频度; 对所述特征词进行聚类,获得多个特征词类别; 根据各个类别下的各个特征词的出现频度,获得各个类别的权重; 保存所述多个特征词类别以及各自的权重,得到所述群体兴趣模型。5.如权利要求4所述的方法,所述类别包括一级类别以及二级类别,每个一级类别下包括多个二级类别,所述保存所述多个特征词类别以及各自的权重包括 以二维矩阵的形式保存各个二级类别的权重,其中,所述二维矩阵中的每一行对应每一一级分类下的各个二级类别; 所述根据各个类别的权重对各个类别进行排序包括 分别将所述二维矩阵中每一行的各个二级类别的权重相加,得到各个一级类别的权重; 根据各个一级类别的权重对各个一级类别进行排序,并根据一级类别下各个二级类别的权重,对各个二级类别进行排序。6.如权利要求4所述的方法,所述根据各个类别下的各个特征词的出现频度,获得各个类别的权重包括 分别对各个类别下的各个特征词的出现频度进行累加,得到各个类别的权重。7.如权利要求4所述的方法,所述根据各个类别下的各个特征词的出现频度,获得各个类别的权重包括 根据搜索引擎服务器统计的特征词热点信息,获取各个特征词的热点程度信息; 根据各个特征词的出现频度以及所述热点程度信息计算各个特征词的综合频度信息; 分别对各个类别下的各个特征词的综合频度信息进行累加,得到各个类别的权重。8.如权利要求7所述的方法,所述根据各个特征词的出现频度以及所述热点程度信息计算各个特征词的综合频度信息包括 将特征词的热点程度信息乘以一加权系数,并与所述出现频度进行相加,得到特征词的综合频度信息;其中,所述加权系数小于I。9.如权利要求2、4-8任一项所述的方法,所述对所述特征词进行聚类,获得多个特征词类别包括 对所述特征词进行归一化处理; 对归一化处理后的特征词进行聚类,获得多个特征词类别。10.如权利要求2、4-8任一项所述的方法,所述从所述历史行为数据中提取特征词包括 将在搜索引擎中输入的搜索关键词作为所述特征词; 或者, 从被访问网页中提取内容关键词作为所述特征词。11.一种网址导航的装置,包括 数据获取单元,用于获取多台基于客户端设备的访问事件的历史行为数据; 建立模型单元,用于根据所述历史行为数据建立客户端设备访问方的群体兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息; 确定类别单元,用于根据所述类别信息确定在网址导航页面中显示的网址类别。12.如权...

【专利技术属性】
技术研发人员:周浩邓夏玮
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1