【技术实现步骤摘要】
个性化网址导航方法和装置
本专利技术涉及浏览器
,具体涉及个性化网址导航方法和装置。
技术介绍
随着计算机技术的发展和互联网用户规模的不断扩大,越来越多的互联网用户使用个人计算机通过互联网获得各种各样所需的信息。同时,为互联网用户提供信息服务的网站也越来越多,互联网网页的数量每天都在以惊人的速度增长,互联网信息呈现出爆发式的增长。对于用户来说,经常需要通过一定的手段,才能在浩如烟海的互联网信息中迅速定位最适合自己需求的网站或者需要的信息,比如通过网址导航服务。网址导航是一个集合较多网址,并按一定条件进行分类的一种网址站,主要为用户提供网址导航服务。网址导航可以使用户不用记忆网站的网址,就能通过网址导航页面提供的链接方便找到自己需要的网站进行浏览和信息检索。同时,现有的网址导航有的还提供了一些比较实用的功能,如号码查询、邮箱登陆、热点新闻、搜索引擎入口等,在一定程度上也为用户的互联网冲浪提供了便利。据统计,目前有相当比例的互联网用户将浏览器的主页设置为网址导航页面,从一个侧面也说明了网址导航服务在实际应用中确实有着方便用户浏览的作用,从而受到了许多用户的欢迎。然而,在现有的网址导航服务技术中,导航内容页面大多是由网址导航产品的运营维护人员人工推荐的静态页面,虽然页面内容内的导航网址可能涉及到许多门类,但相对于互联网上数量巨大并且高速增长的信息量,网址导航内容往往不能够适应互联网用户的浏览需求。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的个性化网址导航方法和相应的装置。依据本专利技术的一个方面,提供了一种 ...
【技术保护点】
一种个性化网址导航方法,包括:获取多台基于客户端设备的访问事件的群体历史行为数据;根据所述群体历史行为数据建立客户端设备访问方的群体兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息;根据单个客户端设备的个体历史行为数据以及所述群体兴趣模型,建立客户端设备访问方的个体兴趣模型,所述个体兴趣模型中保存有体现客户端设备访问方个体访问兴趣点的类别信息;根据所述个体兴趣模型确定在网址导航页面中显示的网址类别。
【技术特征摘要】
1.一种个性化网址导航方法,包括:获取基于多台客户端设备的访问事件的群体历史行为数据;根据所述群体历史行为数据建立客户端设备访问方的群体兴趣模型,所述群体兴趣模型为体现所述客户端访问方群体的访问兴趣的兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息;根据单个客户端设备的个体历史行为数据以及所述群体兴趣模型,建立客户端设备访问方的个体兴趣模型,所述个体兴趣模型中保存有体现客户端设备访问方个体访问兴趣点的类别信息,所述个体兴趣模型为所述群体兴趣模型的子集;根据各个访问方的所述个体兴趣模型确定在各个访问方的网址导航页面中显示的网址类别;其中,所述根据单个客户端设备的个体历史行为数据以及所述群体兴趣模型,建立客户端设备访问方的个体兴趣模型,包括:从所述个体历史行为数据中提取特征词;根据所述群体兴趣模型中保存的类别信息,对各个特征词进行分类,得到若干个特征类别;保存各个特征类别,得到所述个体兴趣模型。2.如权利要求1所述的方法,所述个体兴趣模型中还保存有各个特征类别的权重,所述权重用于体现客户端设备访问方个体对各个类别的感兴趣程度,所述根据各个访问方的所述个体兴趣模型确定在各个访问方的网址导航页面中显示的网址类别包括:根据各个特征类别的权重对各个特征类别进行排序,根据排序结果确定在网址导航页面中显示的网址类别及排列顺序。3.如权利要求1所述的方法,所述根据所述群体历史行为数据建立客户端设备访问方的群体兴趣模型包括:从所述群体历史行为数据中提取特征词;对所述从所述群体历史行为数据中提取的特征词进行聚类,获得多个类别标签,保存所述多个类别标签,得到所述群体兴趣模型。4.如权利要求3所述的方法,所述对所述特征词进行聚类,获得多个类别标签包括:对所述从所述群体历史行为数据中提取的特征词进行归一化处理;对归一化处理后的特征词进行聚类,获得多个类别标签。5.一种个性化网址导航方法,包括:获取基于多台客户端设备的访问事件的群体历史行为数据;根据所述群体历史行为数据建立客户端设备访问方的群体兴趣模型,所述群体兴趣模型为体现所述客户端访问方群体的访问兴趣的兴趣模型,所述兴趣模型中保存有体现客户端设备访问方群体访问兴趣点的类别信息;根据单个客户端设备的个体历史行为数据以及所述群体兴趣模型,建立客户端设备访问方的个体兴趣模型,所述个体兴趣模型中保存有体现客户端设备访问方个体访问兴趣点的类别信息,所述个体兴趣模型为所述群体兴趣模型的子集;根据各个访问方的所述个体兴趣模型确定在各个访问方的网址导航页面中显示的网址类别;其中,所述个体兴趣模型中还保存有各个特征类别的权重,所述权重用于体现客户端设备访问方个体对各个类别的感兴趣程度,所述根据单个客户端设备的个体历史行为数据以及所述群体兴趣模型,建立客户端设备访问方的个体兴趣模型,包括:从所述个体历史行为数据中提取特征词,并获取各个特征词在所述个体历史行为数据中的出现频度;根据所述群体兴趣模型中保存的类别信息,对所述特征词进行分类,得到若干个特征类别;根据各个特征类别中包含的各个特征词的出现频度,获得各个特征类别的权重;保存各个特征类别以及对应的权重,得到所述个体兴趣模型。6.如权利要求5所述的方法,其特征在于,所述根据各个访问方的所述个体兴趣模型确定在各个访问方的网址导航页面中显示的网址类别包括:根据各个特征类别的权重对各个特征类别进行排序,根据排序结果确定在网址导航页面中显示的网址类别及排列顺序。7.如权利要求6所述的方法,所述群体兴趣模型中的类别包括一级类别以及二级类别,每个一级类别下包括多个二级类别,并以二维矩阵的形式保存各个二级类别,其中,所述二维矩阵中的每一行对应每一一级类别下的各个二级类别,所述根据所述群体兴趣模型中保存的类别信息,对所述特征词进行分类,得到若干个特征类别包括:根据所述群体兴趣模型中保存的二级类别信息,对所述特征词进行分类,得到若干个二级特征类别;所述保存各个特征类别以及对应的权重包括:将各个二级特征类别的权重保存到所述二维矩阵对应的元素处;所述根据各个特征类别的权重对各个特征类别进行排序包括:分别将所述二维矩阵中每一行的各个二级特征类别的权重相加,得到一级特征类别的权重;根据各个一级特征类别的权重对各个一级特征类别进行排序,并根据各个二级特征类别的权重,对各个二级特征类别进行排序。8.如权利要求6所述的方法,所述根据各个特征类别中包含的各个特征词的出现频度,获得各个特征类别的权重包括:分别对各个特征类别中包含的各个特征词的出现频度进行累加,得到各个特征类别的权重。9.如权利要求6所述的方法,所述根据各个特征类别中包含的各个特征词的出现频度,获得各个特征类别的权重包括:根据搜索引擎服务器统计的特征词热点信息,获取各个特征词的热点程度信息;根据各个特征词的出现频度以及所述热点程度信息计算各个特征词的综合频度信息;分别对各个特征类别中包含的各个特征词的综合频度信息进行累加,得到各个特征类别的权重。10.如权利要求9所述的方法,所述根据各个特征词的出现频度以及所述热点程度信息计算各个特征词的综合频度信息包括:将特征词的热点程度信息乘以一加权系数,并与所述出现频度进行相加,得到特征词的综合频度信息;其中,所述加权系数小于1。11.如权利要求5所述的方法,其特征在于,所述根据所述群体历史行为数据建立客户端设备访问方的群体兴趣模型包括:从所述群体历史行为数据中提取特征词;对所述从所述群体历史行为数据中提取的特征词进行聚类,获得多个类别标签,保存所述多个类别标签,得到所述群体兴趣模型。12.如权利要求11所述的方法,所述对所述特征词进行聚类,获得多个类别标签包括:对所述从所述群体历史行为数据中提取的特征...
【专利技术属性】
技术研发人员:周浩,邓夏玮,
申请(专利权)人:北京奇虎科技有限公司,奇智软件北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。