【技术实现步骤摘要】
一种网站URL的管理方法
本专利技术涉及搜索引擎领域,尤其涉及一种网站URL的管理方法。
技术介绍
随着社会生产信息化、数字化程度的加深,各行各业均建立了大量的网站和应用管理系统,用于展示与管理其信息资源。数据中心、云计算等信息集中化处理方式的发展,使得大部分单位采取B/S架构开发网站,这种情况下,用户只需要知道该系统的URL(UniformResourceLocator,统一资源定位符),即可利用浏览器访问该网站资源,无需安装额外的客户端,极大降低了用户访问网络资源的难度,同时也提高了网站所有者推广其内容信息的效率。通常,网络中的网站包含众多子模块,每个子模块可能又包含更多的子模块,导致一个网站目录结构层次较多,某些子模块可能需鼠标放置或移动或点击等与页面进行交互后才能显示,而最终不同的子模块通常绑定在不同的URL子目录上。针对用户而言,在首次进入该网站时,可能是通过该系统的根目录URL即域名访问,也可能是通过该网站的子模块URL访问,导致用户难以全面获悉该系统的所有模块层次结构信息,而某些需要与页面进行交互操作才能显现的子模块,更难以被用户快速定位,用户无法从 ...
【技术保护点】
1.一种网站URL的管理方法,其特征在于,包括以下步骤:通过网站指定的URL获取所述网站的所有URL,所述所有URL与所述指定的URL根目录相同;将所述指定的URL以及所述所有URL按照URL目录级别分别存储至数据库;按照所述URL目录级别从所述数据库中依次提取URL,进行层级展示。
【技术特征摘要】
1.一种网站URL的管理方法,其特征在于,包括以下步骤:通过网站指定的URL获取所述网站的所有URL,所述所有URL与所述指定的URL根目录相同;将所述指定的URL以及所述所有URL按照URL目录级别分别存储至数据库;按照所述URL目录级别从所述数据库中依次提取URL,进行层级展示。2.如权利要求1所述的方法,其特征在于,所述步骤“通过网站指定的URL获取所述网站的所有URL”具体包括:根据所述网站指定的URL,获取所述指定的URL根目录;通过指定的URL抓取其所在页面的HTML信息,获取与所述指定的URL根目录相同的URL,将获取的URL去重后存储至缓存列表和正式列表;依次抓取所述缓存列表中每一个URL页面的HTML信息,再次获取与所述指定URL根目录相同的其他URL,将所述再次获取的其他URL存储至临时列表;对比所述临时列表中的URL与所述正式列表中的URL,将在所述临时列表中不同于所述正式列表中的URL添加至所述正式列表。3.如权利要求2所述的方法,其特征还在于,若所述指定的URL本身不为根目录,则将其所有不同目录级别的上级URL自动存储至所述缓存列表和正式列表。4.如权利要求2所述的方法,其特征在于,若获取的URL是以相对路径的形式存在,则将其加上所述指定URL的根目录形成绝对路径,存储至相应的列表。5.如权利要求1所述的方法,其特征还在于,所述步骤“将所述指定...
【专利技术属性】
技术研发人员:林皓,唐彪,熊伟,向达,韩鹏振,冯艳,
申请(专利权)人:北京北信源信息安全技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。