网页浏览记录的处理方法及网页浏览装置制造方法及图纸

技术编号:9667967 阅读:86 留言:0更新日期:2014-02-14 06:27
本发明专利技术涉及一种网页浏览记录的处理方法,包括:生成网页的浏览记录;在该浏览记录中保存该网页的打开时间;根据该网页的正文内容生成并保存关键内容摘要;以及在该浏览记录中保存该关键内容摘要。上述的网页浏览记录的处理方法中,除了保存最基本的打开时间外,还根据网页正文的内容生成并保存关键内容摘要,后续浏览历史记录时可直接显示网页的关键内容摘要,而无须重新加载,使用过程更加直观方便。此外,本发明专利技术还提供一种基于上述方法的网页浏览装置。

【技术实现步骤摘要】
网页浏览记录的处理方法及网页浏览装置
本专利技术涉及网页浏览技术,尤其涉及一种网页浏览记录的处理方法及网页浏览装置。
技术介绍
浏览器作为众多网络服务的入口对于用户的上网体验具有举足轻重的影响,因此各厂商也都积极部署各平台下的浏览器。在浏览器中一般都会提供历史浏览记录的存储功能,方便用户追溯自己访问过的网络服务。然而在现有的浏览器中,一般只会保存网页的网址、标题。在浏览器的历史记录页面中会按时间以列表的方式列出访问过的网址及标题。如果用户需要再次了解具体的网页内容,需要在浏览网页时保存离线备份,或者重新加载网页。
技术实现思路
有鉴于此,有必要提供一种网页浏览记录的处理方法及网页浏览装置,其可以采用一种更加方便直观的方式处理网页浏览记录。一种网页浏览记录的处理方法,包括:生成网页的浏览记录;在该浏览记录中保存该网页的打开时间;根据该网页的正文内容生成并保存关键内容摘要;以及在该浏览记录中保存该关键内容摘要。一种网页浏览装置,包括:记录生成模块,用于生成网页的浏览记录;打开时间保存模块,用于在该浏览记录中保存该网页的打开时间;关键内容摘要生成模块,用于根据该网页的正文内容生成并保存关键内容摘要;以及关键内容摘要保存模块,用于在该浏览记录中保存该关键内容摘要。上述的网页浏览记录的处理方法网页浏览装置中,除了保存最基本的打开时间夕卜,还根据网页正文的内容生成并保存关键内容摘要,后续浏览历史记录时可直接显示网页的关键内容摘要,而无须重新加载,使用过程更加直观方便。为让本专利技术的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。【附图说明】图1为第一实施例提供的网页浏览记录的处理方法流程示意图。图2为第二实施例提供的网页浏览记录的处理方法流程示意图。图3为第三实施例提供的网页浏览记录的处理方法流程示意图。图4为第四实施例提供的网页浏览记录的处理方法流程示意图。图5为第四实施例提供的网页浏览记录的处理方法显示的时间轴的示意图。图6为第五实施例提供的网页浏览装置的结构框图。图7为第六实施例提供的网页浏览装置的结构框图。图8为第七实施例提供的网页浏览装置的结构框图。图9为第八实施例提供的网页浏览装置的结构框图。【具体实施方式】为更进一步阐述本专利技术为实现预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的网页浏览记录的处理方法及网页浏览装置的【具体实施方式】、结构、特征及其功效,详细说明如后。图1为第一实施例提供的网页浏览记录的处理方法流程示意图。如图1所示,该方法包括:步骤S110,生成网页的浏览记录。例如,在用户点击链接后或者在地址栏直接输入网址后浏览器开始加载网页,同时会生成一条网页浏览记录,用于存储访问的网页的信息。可以理解,此处的一条网页浏览记录是逻辑上的概念,即多个与该网页相关的数据共同构成一条网页浏览记录,但是并不限制其具体的存储方式,可以是一个字符串,也可以是一个对象。步骤S120,在该浏览记录中保存该网页的打开时间。打开时间例如是指用户点击链接的时间或者在地址栏直接输入网址后确定的时间。步骤S130,根据该网页的正文内容生成并保存关键内容摘要;以及步骤S140,在该浏览记录中保存该关键内容摘要。根据不同的网页,其关键内容会有不同。例如,新闻网页,其关键内容就是该新闻正文或者新闻片,图片浏览网页,其关键内容就是图片,音视频网页,其关键内容就是音视频内容,对于图片、音视频等,与之匹配的说明性文字同样属于关键内容。因此步骤S130具体可以包括:识别该网页的关键内容;以及提取该网页中与该关键内容相关的至少部分文字或至少部分多媒体内容。识别该网页的关键内容可以按以下步骤进行:在网页加载完成后获取该网页的文件对象模型(Document Object Model, DOM),并遍历DOM,从中提取正文部分所包含多媒体内容的标签,多媒体内容的标签例如是指<object>、〈embed>或<img>等标签。判断标签属性,判断其是否属于关键内容。上述的正文部分的识别,以及根据标签属性判断其是否属于关键内容,在现有的网页智能识别技术中已经属于习知内容,在此不再赘述。对于多媒体格式的关键内容,可以将其整体存储作为关键内容摘要。然而可以理解,多媒体内容可能需要较多的存储空间,因此在存储之前还可进行压缩或者剪辑处理。例如,对图片进行压缩或者裁减,对音视频文件进行剪辑处理。当不存在多媒体内容时,可以确定网页为文字型网页,将其正文内容全部或者部分作为该网页的关键内容摘要即可。获取关键内容摘要后,即可将其保存于浏览记录中。可以理解,此处的保存于浏览记录中,是指在逻辑上与该浏览记录相互关联,并不限定一定处于同一物理存储区域中。例如,可以将多媒体内容另行存储,而将其索引存储于该浏览记录中。此外,除了上述的打开时间及关键内容摘要,还可在浏览记录中保存其他字段,从而形成以下的浏览记录的存储结构:Struct {string title, string link, string show_txt, bool bflag, string html_media, Time Opentime, Time CloseTime}。其中,title 表示网页的标题,link表示网址、show_txt表示关键内容摘要的文字,bflag表示是否具有多媒体内容,html_media表示多媒体内容,OpenTime表示打开时间,而CloseTime表示关闭时间。可以理解,经过步骤S140后,如果浏览记录是存储于易失性存储器中时,还需要将其转存至非易失性存储器例如闪存、硬碟中才能重复利用。上述的转存过程例如是指写入文件或者数据库系统。本实施例提供的网页浏览记录的处理方法中,除了保存最基本的打开时间外,还根据网页正文的内容生成并保存关键内容摘要,后续浏览历史记录时可直接显示网页的关键内容摘要,而无须重新加载,使用过程更加直观方便。图2为第二实施例提供的网页浏览记录的处理方法流程示意图。如图2所示,其与第一实施例的网页浏览记录的处理方法相似,其不同之处在于,还包括:步骤S210,在该网页所对应的标签页被激活时在该浏览记录中保存该网页的激活时间。在浏览器中一般都可以同时显示多个标签页,每个标签页对应一个网址,但同一个浏览器实例,同一时刻只能有一个标签页处于活动状态,通过监测标签页的激活事件,可以记录标签页的激活时间。可以理解,从回溯历史浏览记录的角度而言,标签页的激活时间可以视为该网址被再次打开的时间,因此本实施例提供的网页浏览记录的处理方法中,后续显示历史记录时可以完全重现浏览器的浏览过程。图3为第三实施例提供的网页浏览记录的处理方法流程示意图。如图3所示,其与第一实施例的网页浏览记录的处理方法相似,其不同之处在于,还包括:步骤S310,对该网页进行分类;以及步骤S320,在该浏览记录中保存该网页的类别。网页的类别例如是根据网页的属性做出的分类,例如,新闻、科技、娱乐、体育、明星等等。网页的分类可以是基于网址匹配,即先建立网址分规则库,然后根据库内的规则对网页进行分类,而当没有匹配的规则时必须进行人工分类,或者采用基于自然语言识别的网页分类器进行分类。本实本文档来自技高网...

【技术保护点】
一种网页浏览记录的处理方法,包括:生成网页的浏览记录;在该浏览记录中保存该网页的打开时间;根据该网页的正文内容生成并保存关键内容摘要;以及在该浏览记录中保存该关键内容摘要。

【技术特征摘要】
1.一种网页浏览记录的处理方法,包括: 生成网页的浏览记录; 在该浏览记录中保存该网页的打开时间; 根据该网页的正文内容生成并保存关键内容摘要;以及 在该浏览记录中保存该关键内容摘要。2.如权利要求1所述的网页浏览记录的处理方法,其特征在于,根据网页的正文内容生成并保存关键内容摘要包括: 识别该网页的关键内容; 提取该网页中与该关键内容相关的至少部分文字和/或至少部分多媒体内容。3.如权利要求2所述的网页浏览记录的处理方法,其特征在于,所述多媒体内容在被保存之前还经过压缩和/或剪辑处理。4.如权利要求1所述的网页浏览记录的处理方法,其特征在于,还包括: 对该网页进行分类; 在该浏览记录中保存该网页的类别。5.如权利要求1-4任一项所述的网页浏览记录的处理方法,其特征在于, 还包括: 显不一个时间轴; 加载打开时间在该时间轴的当前时间范围内的浏览记录; 根据打开时间将加载的浏览记录中的关键内容摘要显示于该时间轴中相应的位置。6.如权利要求5所述的网页浏览记录的处理方法,其特征在于,加载打开时间在该时间轴的当前时间范围内的浏览记录时还根据浏览记录中网页的类别进行过滤。7.一种网页浏览装置,包括: 记录生成模块,用于生成网页的浏览记录; 打开时间保存模块,用于在该浏览记录中...

【专利技术属性】
技术研发人员:童洋张艺弘
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1