【技术实现步骤摘要】
网站页面在搜索引擎中收录数量的检测方法和装置
本专利技术涉及互联网领域,具体而言,涉及一种网站页面在搜索引擎中收录数量的 检测方法和装置。
技术介绍
随着互联网搜索技术的发展,由搜索引擎带来的访问流量占据着网站访问流量的 主要比例。搜索引擎来源的流量分为付费搜索流量和自然搜索(即非付费搜索)流量。其 中付费搜索的投放需要一定的资金成本,而自然搜索带来的流量是免费的、高质量的、稳定 的。因此,越来越多的站长(广告主)关注自己网站在自然搜索的表现。 自然搜索的表现即自然搜索流量的大小是由自然搜索结果的排名直接决定的。要 想提高网站在自然搜索结果中的排名表现,首先需要优化网站的结构,让搜索引擎通过爬 虫能够抓取到网站尽可能多的页面,以提高网站在搜索引擎中的收录数量,再对页面去做 关键词部署优化,进而提高网站在自然搜索结果中的排名。因此,搜索引擎收录数量的提 升,是优化网站的前提和基础。 提高网站在搜索引擎中的收录数量,可以通过采用适应搜索引擎爬虫算法的方式 去优化网页代码以及调整网站的层级结构等方法实现。在不断的适应和调整过程中,网站 的收录数量会随之变化,同时,由于搜索引擎的算法也会有持续的调整,因此网站主需要关 注网站在搜索引擎中的收录数量,来衡量自身网站的优化效果。准确掌握搜索引擎收录量 的数据变化是至关重要的,为此,搜索引擎提供了一种通过输入搜索代码来查询网站收录 数量的方法。该方法是通过在搜索引擎搜索框中输入查询命令,搜索引擎从服务器中检索 并返回数值来实现的。但是,搜索引擎将网站已经收录的网络地址采用分布式存储的方 ...
【技术保护点】
一种网站页面在搜索引擎中收录数量的检测方法,其特征在于,包括:获取待检测网站的所有页面的网络地址;从所述待检测网站的所有页面的网络地址中确定待查询网络地址;获取包含所述待查询网络地址的网络地址;遍历包含所述待查询网络地址的网络地址,检测包含所述待查询网络地址的网络地址对应的页面是否被搜索引擎收录;如果检测到包含所述待查询网络地址的网络地址对应的页面被所述搜索引擎收录,将所述待查询网络地址对应的网页在所述搜索引擎中的收录数量进行累加。
【技术特征摘要】
1. 一种网站页面在搜索引擎中收录数量的检测方法,其特征在于,包括: 获取待检测网站的所有页面的网络地址; 从所述待检测网站的所有页面的网络地址中确定待查询网络地址; 获取包含所述待查询网络地址的网络地址; 遍历包含所述待查询网络地址的网络地址,检测包含所述待查询网络地址的网络地址 对应的页面是否被搜索引擎收录; 如果检测到包含所述待查询网络地址的网络地址对应的页面被所述搜索引擎收录,将 所述待查询网络地址对应的网页在所述搜索引擎中的收录数量进行累加。2. 根据权利要求1所述的网站页面在搜索引擎中收录数量的检测方法,其特征在于, 在获取待检测网站的所有页面的网络地址之后,所述方法还包括: 检测是否已经成功获取所述待检测网站的所有页面的网络地址;以及 如果检测到已经成功获取所述待检测网站的所有页面的网络地址,将所述待检测网站 的所有页面的网络地址存入所述待检测网站的页面网络地址列表中。3. 根据权利要求1所述的网站页面在搜索引擎中收录数量的检测方法,其特征在于, 所述待查询网络地址为以下任意一类或者多类网络地址: 第一类别网络地址,所述第一类别网络地址为所述待检测网站的首页的网络地址; 第二类别网络地址,所述第二类别网络地址为所述待检测网站的二级域名网络地址; 以及 第三类别网络地址,所述第三类别网络地址为所述待检测网站的所有页面的网络地址 中除所述第一类别网络地址和所述第二类别网络地址之外的网络地址。4. 根据权利要求3所述的网站页面在搜索引擎中收录数量的检测方法,其特征在于, 检测包含所述待查询网络地址的网络地址对应的页面是否被搜索引擎收录包括: 判断所述待查询网络地址是否是所述第一类别网络地址; 如果判断出所述待查询网络地址是所述第一类别网络地址,遍历所述待检测网站的所 有页面; 检测所述待检测网站的所有页面是否被所述搜索引擎收录; 如果判断出所述待查询网络地址不是所述第一类别网络地址,判断所述待查询网络地 址是否是所述第二类别网络地址; 如果判断出所述待查询网络地址是所述第二类别网络地址,遍历所述待检测网站的所 有二级域名网络地址对应的页面; 检测所述待检测网站的所有二级域名网络地址对应的页面是否被所述搜索引擎收 录; 如果判断出所述待查询网络地址不是所述第二类别网络地址,遍历所述待检测网站的 所有页面的网络地址中除所述第一类别网络地址和所述第二类别网络地址之外的网络地 址对应的页面;以及 检测所述待检测网站的所有页面的网络地址中除所述第一类别网络地址和所述第二 类别网络地址之外的网络地址对应的页面是否被所述搜索引擎收录。5. 根据权利要求4所述的网站页面在搜索引擎中收录数量的检测方法,其特征在于, 检测所述待检测网站的所有页面是否被所述搜索引擎收录包括: 分别在所述搜索引擎中搜索所述待检测网站的所有页面的网络地址; 判断所述搜索引擎中的搜索结果是否提示未找到所述待检测网站的所有页面的网络 地址;以及 如果判断出所述搜索引擎中的搜索结果未提示未找到所述待检测网站的所有页面的 网络地址,确定所述待检测网站的所有页面被所述搜索引擎收录, 检测所述待检测网站的所有二级域名网络地址对应的页面是否被所述搜索引擎收录 包括: 分别在所述搜索引擎中搜索所述待检测网站的所有二级域名网络地址对应的页面的 网络地址; 判断所述搜索引擎中的搜索结果是否提示未找到所述待检测网站的所有二级域名网 络地址对应的页面的网络地址;以及 如果判断出所述搜索引擎中的搜索结果未提示未找到所述待检测网站的所有二级域 名网络地址对应的页面的网络地址,确定所述待检测网站的所有二级域名网络地址对应的 页面被所述搜索引擎收录, 检测所述待检测网站的所有页面的网络地址中除所述第一类别网络地址和所述第二 类别网络地址之外的网络地址对应的页面是否被所述搜索引擎收录包括: 分别在所述搜索引擎中搜索所述待检测网站的所有页面的网络地址中除所述第一类 别网络地址和所述第二类别网络地址之外的网络地址对应的页面的网络地址; 判断所述搜索引擎中的搜索结果是否提示未找到所述待检测网站的所有页面的网络 地址中除所述第一类别网络地址和所述第二类别网络地址之外的网络地址对应的页面的 网络地址;以及 如果判断出所述搜索引擎中的搜索结果未提示未找到所述待检测网站的所有页面的 网络地址中除所述第一类别网络地址和所述第二类别网络地址之外的网络地址对应的页 面的网络地址,确定所述待检测网站的所有页面的网络地址中除所述第一类别网络地址和 所述第二类别网络地址之外的网络地址对应的页面被所述搜索引擎收录。6.根据权利要求3所述的网站页面在搜索引擎中收录数量的检测方法,其特征在于, 获取包含所述待查询网络地址的网络地址包括: 判断所述待查询网络地址是否是所述第一类别网络地址; 如果判断出所述待查询网络地址是所述第一类别网络地址,确定所述包含所述待查询 网络地址的网络地址为所述待检测网站的所有页面的网络地址;以及 将所述待检测网站的所有页面的网络地址存入第一待查询网络地址列表, 或者, 判断所述待查询网络地址是否是所述第二类别网络地址; 如果判断出所述待查询网络地址是所述第二类别网络地址,确定所述包含所述待查询 网络地址的所有网络地址为所述待检测网站的所有二级域名网络地址对应的页面的网络 地址;以及 将所述待检测网站的所有二级域名网络地址对应的页面的网络地址存入第二待查询 网络地址列表, 或者, 判断所述待查询网络地址是否是所述第三类别网络地址; 如果判断出所述待查询网络地址是所述第三类别网络地址,确定所述包含所述待查询 网络地址的所有网络地址为所述待检测网站的所有页面的网络地址中除所述第一类别网 络地址和所述第二类别网络地址之外的网络地址;以及 将所述待检测网站的所有页面的网络地址中除所述第一类别网络地址和所述第二类 别网络地址之外的网络地址存入第三待查询网络地址列表。7. 根据权利要求6所述的网站页面在搜索引擎中收录数量的检测方法,其特征在于, 如果检测到包含所述待查询网络地址的网络地址对应的页面被搜索引擎收录,将所述待查 询网络地址...
【专利技术属性】
技术研发人员:姜世豪,杨韬,王晓群,谭紫萱,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。