一种实现网页内容预览的方法和设备技术

技术编号:6863848 阅读:417 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种实现网页预览的方法和设备,通过应用本发明专利技术的技术方案,可以通过获取网页中或即时通信工具中的URL所对应的网页的关键内容,实现对该网页内容的预览,在保证用户了解网页内容的情况下,降低了用户因访问未知网页而感染病毒的危险,提高了网络应用过程中的安全性,而关键内容预览的形式,也降低了下载网页全部内容所带来的系统资源和网络的占用,改善了用户的使用体验。

【技术实现步骤摘要】

本专利技术涉及互联网信息处理领域,尤其涉及一种实现网页内容预览的方法和设备
技术介绍
随着互联网科技的不断前进与发展,人们对于网页内容的浏览速度也在不断加快。互联网中的网页通常是HTML (Hyper Text Mark-up Language,超文本标记语言或超文本链接标示语言)格式,一般经由URL(UniversalResource Locator,统一资源定位符)来识别与获取,当用户在浏览器输入网址后,经过一系列的信令交互处理和数据传输,网页文件会被传送到用户的计算机,然后再通过浏览器将网页的内容展示到用户的眼前。TOB内容一般包括普通文本文件、图片、脚本文件、风格文件等多种资源,这些资源通过 HTTP (Hypertext Transfer Protocol,超文本传输协议)协议进行传输。当用户想要浏览一个网页的时候,通常会通过一个浏览器加载所要浏览的页面, 例如利用IE (Internet Explorer,互联网浏览器)加载一个网站首页,则该网站首页呈现在用户面前,由于网页中包含有大量的链接,因此,用户想要快速了解某一个链接的具体内容,只能是通过链接的锚文本了解网页的大概内容,然后再去判断是否需要进一步点击URL 进入相应的页面去了解详细的信息内容。此外,在用户利用即时通讯工具进行信息通讯时,经常会收到对端用户发送来的带有URL链接的文字内容,用户如果想知道此URL链接的具体内容,也必须点击此URL链接后,获取网页的全部内容来实现。专利技术人在实现本专利技术的过程中,发现现有技术至少存在以下缺陷现有技术中,对于利用浏览器加载需要访问的页面的情况,因为页面包含大量链接,用户只能通过链接的锚文本了解网页内容,然后才能判断是否需要进一步点击URL进入相应的页面去了解详细的信息内容,专利技术人认为这种网页打开模式存在以下三个问题第一、通过链接的锚文本对网页进行网页内容了解时,由于可显示内容非常有限, 所以,用户由此对网页的具体详细内容知之甚少,不足以判断是否应进行下一步的操作;第二、打开页面的时候需要下载很多信息内容。例如页面中的图片信息、脚本文件、音乐以及Flash动画等,这样会大大降低浏览速度,如果用户的带宽很小,可能会出现页面卡死现象,甚至会使系统出现暂时down机状态,影响其他应用软件的运行状态;第三、对于一些链接到未知网站的网页,由于不能判断网页的安全性能,因此打开链接时候很容易遭受病毒的侵犯,例如蠕虫病毒、木马病毒等,直接对系统造成危害,甚至会成为“肉鸡”。对于即时通讯工具而言,如果用户在打开对端用户发送过来的URL链接,不仅会使打开速度变慢,也很容易被病毒攻击。此外,大多数情况下,浏览器所显示的网页中包含有很多的URL链接,如果想通过预下载方式进行网页内容的了解,基本上很难实现,因为不知道用户下一步将要预览哪个网页,如果对整个网页中的所有URL链接内容都要下载,将需要消耗很大的带宽,占用大量的系统资源,同时,网络传输速度上也不允许。
技术实现思路
本专利技术提供了一种实现网页预览的方法和设备,通过触发事件来获取网页的关键内容,并实现对网页内容的预览过程。本专利技术提供了一种实现网页预览的方法,包括以下步骤当达到预设的预览触发条件时,获取待预览网页的URL ;下载所述URL对应的待预览网页的文本内容;根据所述待预览网页的文本内容的类型,获取所述待预览网页的关键内容;通过显示窗口显示所述待预览网页的关键内容。优选的,所述预设的预览触发条件,具体包括指针在一个URL上停留的时间达到预设的停留时间阈值;或,当指针停留在一个URL上时,接收到通过预设按键或预设的按键操作触发的网页预览指令。优选的,所述通过预设按键或预设的按键操作触发的网页预览指令,具体为单击鼠标右键所触发的网页预览指令;或,按下鼠标右键的时间达到预设的时间阈值时,所触发的网页预览指令;或,按下多个按键所组成的按键组合所触发的网页预览指令;或,按下多个按键所组成的按键组合达到预设的时间阈值时,所触发的网页预览指令。优选的,根据所述待预览网页的文本内容的类型,获取所述待预览网页的关键内容,具体包括按照预设的识别规则,根据下载的所述URL对应的页面文本,识别待预览网页的文本内容的类型;当所述待预览网页的文本内容为内容型网页时,获取所述待预览网页的正文内容作为关键内容;当所述待预览网页的文本内容为目录型网页时,获取所述待预览网页的重要块作为关键内容。优选的,所述当所述待预览网页的文本内容为内容型网页时,获取所述待预览网页的正文内容作为关键内容,具体为统计所述待预览网页中的各文本块的大小,确定最大文本块;判断是否需要对所述最大文本块所对应节点进行扩展,如果需要,则进行扩展,并通过扩展后的内容更新所述最大文本块的内容;对所述最大文本块的内容进行分析,确定噪声信息;删除所述最大文本块中的噪声信息,将剩余的内容作为所述待预览网页的关键内容。优选的,统计所述待预览网页中的各文本块的大小,确定最大文本块,还包括根据所述待预览网页中的各文本块的大小,确定次大文本块;判断所述最大文本块是否为版权信息块;如果是,则将所述次大文本块确定为最大文本块。优选的,所述判断是否需要对所述最大文本块所对应节点进行扩展,具体为确定所述最大文本块所对应节点的父节点下所包含的文本长度;判断所述最大文本块所对应节点下所包含的文本长度与所述父节点下所包含的文本长度的比例,是否小于预设阈值;如果小于,将所述最大文本块所对应节点的内容向所述父节点的内容进行扩展, 如果不小于,则不需要对所述最大文本块所对应节点进行扩展。优选的,所述噪声信息,具体包括以下内容中的一项或多项所述最大文本块中所包含的图像、图像标题和评论信息。优选的,当所述待预览网页的文本内容为目录型网页时,获取所述待预览网页的重要块作为关键内容,具体为识别所述待预览网页的文本内容中所包含的各块的类型;删除所述待预览网页的文本内容中的导航块和广告块,将剩余的重要块作为所述待预览网页的关键内容。优选的,通过显示窗口显示所述待预览网页的关键内容,具体为通过当前窗口所对应的的浮动窗口显示所述待预览网页的关键内容;或,通过新的窗口显示所述待预览网页的关键内容。另一方面,本专利技术还提供了一种实现网页预览的设备,具体包括设置模块,用于设置预览触发条件;获取模块,与所述设置模块连接,用于当达到所述设置模块所设置的预览触发条件时,获取待预览网页的URL ;下载模块,与所述获取模块连接,用于根据所述获取模块所获取的URL,下载相对应的待预览网页的文本内容;处理模块,与所述下载模块连接,用于识别所述下载模块所下载的待预览网页的文本内容的类型,获取所述待预览网页的关键内容;显示模块,与所述处理模块连接,用于通过显示窗口显示所述处理模块所获取的待预览网页的关键内容。优选的,所述设置模块所设置的预览触发条件,具体包括指针在一个URL上停留的时间达到预设的停留时间阈值;或,当指针停留在一个URL上时,接收到通过预设按键或预设的按键操作触发的网页预览指令;其中,所述通过预设按键或预设的按键操作触发的网页预览指令,具体为单击鼠标右键所触发的网页预览指令;或,按下鼠标右键的时间达到预设的时间阈值时,所触发的网页预览指令;或,按下多个按键所组成的按键组合所触发的网页本文档来自技高网
...

【技术保护点】
1.一种实现网页预览的方法,其特征在于,包括以下步骤:当达到预设的预览触发条件时,获取待预览网页的URL;下载所述URL对应的待预览网页的文本内容;根据所述待预览网页的文本内容的类型,获取所述待预览网页的关键内容;通过显示窗口显示所述待预览网页的关键内容。

【技术特征摘要】

【专利技术属性】
技术研发人员:方高林
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1