【技术实现步骤摘要】
本专利技术涉及互联网信息处理
,特别是涉及一种网址导航的方法和 系统。
技术介绍
目前随着互联网技术应用的越来越广泛,人们4艮多的日常工作和娱乐都在 网络上进行,从而产生了众多的互联网网页和海量的网络资源信息,以及提供 各种信息服务的网站,用户一般需要通过网址找到这些信息,但是人们是无法 记忆或者知悉成千上万的网址的,并且,网址也没有很好的规律便于用户记忆,因此,现有技术提出了网址导航的解决方案,例如,hao123网址之家这样的 网址导4元网站。hao123作为网址导航网站,其向用户呈现了数千个常用的网址,并进行 了分类排序等^更于用户查找的进一步处理,从而可以方便用户进入自己所需的 网站。但是现有技术中的网址导航数据主要都是通过人工收集和整理的,该方式 成本太高,速度慢,并且难以收集更大量的网站,^b啦形成大规模的数据。总之,需要本领域技术人员迫切解决的一个技术问题就是如何能够提供 一种更加高效便捷的网址导航技术解决方案。
技术实现思路
本专利技术所要解决的技术问题是提供一种生成导航数据库的方法和系统,以 及利用该导航数据库进行网址导航的方法和装置,能够非常方便的通过计算机 自动发现导航数据,成本低廉、收集效率高,适于收集大规模的导航数据,进 而向用户提供更准确、范围更广泛的网址导航服务。为了解决上述问题,本专利技术公开了一种生成导航数据库的方法,包括分 析搜索日志信息,获取在一信息查询词下,用户点击频率符合预置条件的网址; 所述搜索日志信息包括信息查询词及被用户点击的网址;依据信息查询词获取 针对所述网址的描述信息;所述描述信息包括关键词;依据所获 ...
【技术保护点】
一种生成导航数据库的方法,其特征在于,包括: 分析搜索日志信息,获取在一信息查询词下,用户点击频率符合预置条件的网址;所述搜索日志信息包括信息查询词及被用户点击的网址; 依据信息查询词获取针对所述网址的描述信息;所述描述信息包括关键词; 依据所获得的网址和相应的描述信息,建立导航数据库。
【技术特征摘要】
1、一种生成导航数据库的方法,其特征在于,包括分析搜索日志信息,获取在一信息查询词下,用户点击频率符合预置条件的网址;所述搜索日志信息包括信息查询词及被用户点击的网址;依据信息查询词获取针对所述网址的描述信息;所述描述信息包括关键词;依据所获得的网址和相应的描述信息,建立导航数据库。2、 如权利要求l所述的方法,其特征在于,所述依据信息查询词获得描 述信息的步骤进一步包括获取所述网址相应的锚文本和/或相应的主题名称;分析所述网址的锚文本和/或主题名称、以及相应的用户查询词,获取针 对所述网址的描述信息。3、 如权利要求1或2所述的方法,其特征在于,所述描述信息还包括点 击频率。4、 如权利要求3所述的方法,其特征在于,所述网址和相应的关键词采 用倒排表的数据结构。5、 如权利要求4所述的方法,其特征在于,还包括按照点击频率,对 关键词指向的网址进行排序。6、 如权利要求3所述的方法,其特征在于,还包括依据所述搜索日志 信息对所述描述信息和网址进行校验的步骤,所述校验包括去除针对该关键词的点击频率小于或等于一定阈值的网址;和/或,去除在用户搜索查询中出现频率小于或等于一定阈值的关4A词。7、 一种网址导航的方法,其特征在于,包括分析搜索日志信息,获取在一信息查询词下,用户点击频率符合预置条件 的网址;所述^t索日志信息包括信息查询词及^^皮用户点击的网址;依据信息查询词获取针对所述网址的描述信息;所述描述信息包括关键词;依据所获得的网址和相应的描述信息,建立导航数据库; 接收用户的网址查询词,4全索所述导4元数据库,向用户返回相应的网址结果集。8、 如权利要求7所述的方法,其特征在于,所述依据信息查询词获得描 述信息的步骤进一步包括获取所述网址相应的锚文本和/或相应的主题名称;分析所述网址的锚文本和/或主题名称、以及相应的用户查询词,获取针 对所述网址的描述信息。9、 如权利要求7或8所述的方法,其特征在于,所述描述信息还包括点 击频率。10、 如权利要求9所述的方法,其特征在于,所述网址和相应的关键词采 用倒排表的数据结构。11、 如权利要求10所述的方法,其特征在于,还包括按照点击频率, 对关键词指向的网址进行排序。12、 如权利要求9所述的方法,其特征在于,还包括依据所述搜索日志 信息对所述描述信息和网址进行校验的步骤;所述校验包括去除针对该关键词的点击频率小于或等于一定阈值的网址;和/或,去除在用户搜索查询中出现频率小于或等于一定阈值的关键词。13、 如权利要求7所述的方法,其特征在于,还包括 采集与导航数据相关的权重参数;利用所述权重参数修正导航数据的匹配程度和/或排序情况。14、 一种生成导航数据库的系统,其特征在于,包括 日志分析单元,用于分析搜索日志信息,获取在一信息查询词下,用户点击频率符合预置条件的...
【专利技术属性】
技术研发人员:张智敏,茹立云,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。