【技术实现步骤摘要】
链接的显示方法、系统、存储介质和处理器
本专利技术涉及数据显示
,尤其涉及一种链接的显示方法、系统、存储介质和处理器。
技术介绍
如今,为了实现对网站的运行数据进行分析或者网站的质量进行监控,采用爬虫技术抽取网站网页中超文本引用href(HypertextReference)中的链接。爬虫技术是一种按照一定的规则,自动地抓取网页链接的程序或者脚本。专利技术人对现有的采用爬虫技术抽取网页中链接的过程进行研究发现,当对当前网页中的链接抽取完成时,只能确定当前网页抽取完成,并不能显示当前网页中哪些链接被抽取到。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种链接的显示方法、系统、存储介质和处理器,具体的方案如下:一种链接的显示方法,包括:获取目标网页对应的目标链接,所述目标链接是根据预设的抽取条件从所述目标网页的超文本引用中抽取的;获取所述目标网页对应的HTML源码;将所述HTML源码中与所述目标链接对应的链接进 ...
【技术保护点】
1.一种链接的显示方法,其特征在于,包括:/n获取目标网页对应的目标链接,所述目标链接是根据预设的抽取条件从所述目标网页的超文本引用中抽取的;/n获取所述目标网页对应的HTML源码;/n将所述HTML源码中与所述目标链接对应的链接进行区别显示。/n
【技术特征摘要】
1.一种链接的显示方法,其特征在于,包括:
获取目标网页对应的目标链接,所述目标链接是根据预设的抽取条件从所述目标网页的超文本引用中抽取的;
获取所述目标网页对应的HTML源码;
将所述HTML源码中与所述目标链接对应的链接进行区别显示。
2.根据权利要求1所述的方法,其特征在于,获取目标网页对应的目标链接,包括:
判断目标网页对应的目标链接是否抽取完成;
若是,则获取所述目标链接;
若否,则采用爬虫技术根据所述预设的抽取条件,从所述目标网页的超文本引用中抽取与所述目标网页对应的目标链接。
3.根据权利要求1所述的方法,其特征在于,在获取所述目标网页的目标链接后,所述方法还包括:
获取所述HTML源码的预设基础节点下的基础链接;
判断所述目标链接是否与所述基础链接相同;
如果相同,则确定所述目标链接为基础链接;和/或,
如果不同,则确定所述目标链接为相对链接,并将所述相对链接转换为绝对链接。
4.根据权利要求3所述的方法,其特征在于,将所述相对链接转换为绝对链接,包括:
判断所述相对链接中是否存在锚点;
如果存在,则删除所述相对链接中的锚点,并将所述基础链接与删除锚点后的相对链接按顺序进行拼接,得到绝对链接;和/或,
如果不存在,则将所述基础链接与所述相对链接按顺序进行拼接,得到绝对链接。
5.根据权利要求1所述的方法,其特征在于,将所述HTML源码中与所述目标链接对应的链接...
【专利技术属性】
技术研发人员:张野,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。