一种面向浏览器的网页标注系统技术方案

技术编号:4287954 阅读:387 留言:0更新日期:2012-04-11 18:40
面向浏览器的网页标注系统,由用于添加或编辑标注生成信息的标注与标签模块、存储模块、定位与显示模块组成。定位与显示模块用于在网页中定位显示标注,过程为:获取浏览器底层的文档类型接口,并获取与选中网页内容相应的文本信息;生成按标签信息所指定呈现样式显示标注内容的HTML标记文本来替换文本信息,形成新的网页文档内容。本发明专利技术可以针对不同浏览器显示的网页实现各种标注操作;标注成为网页文档的内容组成部分,不改变Web页面的格式、文件结构或显示风格;存储的标注生成信息脱离具体应用环境,被其他工具复用、共享和再加工;标注生成信息可存储到存储服务器或相关硬件设备上。本发明专利技术可广泛应用到PDA、PC、笔记本等设备上。

【技术实现步骤摘要】

本专利技术属于web网页
,特别是涉及一种面向浏览器的网页标注系统
技术介绍
标注是指第三方对原文档创建和增加的数据。这些数据可以是笔记、符号、图片、 语音片断等。类似的标注概念还有"标注也可以称为做笔记,包括能被感知的视觉化和声 音化信息的输入、处理和输出,这些信息用不同的格式记载。"对Web页面标注就是对浏览 器中任意Web文档或选定的文档内容添加包括提示、解释、重点、体会、疑问、解答和评价等 外部备注信息或标记。网页标注,即对网页中的选定文本做标记,并添加标注内容。 标注根据其被标注的文档不同,分为纸质形式的标注和数字形式的标注两种。本 专利技术关注的是数字形式的标注。标注的主要作用是用来记忆、思考、阐释和共享。在标注的 描述方面,通常采用内容、形式和功能来描述。 数字形式的标注,也称电子标注,按照存储形式分为一是文本与标注数据不分离 的文档标注软件,如Adobe Acrobat, CajViewer, MS Word等;二是文本与标注数据分开存 储的网页标注软件,如Annotator, Annotea, Markup等。前一种存储形式完全模拟了纸质 标注的特点,是标注和原文本一体的形式。他人要查看标注时,需采用整本传阅的方式。后 一种分开存储的形式,主要针对网页进行标注,将原文档与标注分开存储于数据库中。这种 方式有利于信息在网上的直接共享。因此,国外的标注软件多采用分开存储的形式。 现有分开存储的页面标注技术主要有两种第一种为基于代理的标注技术。采用 这种标注方式中,标注被分开存储。客户端需安装代理服务器,由代理服务器将标注与网页 结合实现标注功能。因此这种标注技术的不足之处是客户端必须安装代理服务器,增加了 客户端的负担和普及的难度。第二种为基于增强浏览器的标注技术。增强浏览器是指浏览 器使用插件,以增强浏览器功能,如Netsc即e、 Mozilla Suite、 Mozilla Firefox和Opera 浏览器等。最常安装的外挂有Macromedia Flash播放器和Java运行时刻环境(JRE)等。 通过插件方式将网页内容与标注数据进行绑定,实现标注。主要功能包括(1)标注的创建、 修改、删除;(2)在线查看含有标注的文档;(3)标注的过滤、检索、共享。上述标注技术存在 的主要问题是(l)增强的浏览器方式与普通浏览器的结构和功能差异较大,需要专有技 术的支持,如Word插件、Adobe Acrobat等,是文档标注工具的应用延伸;(2)标注信息与 网页内容采用了外挂的显示方式,页内容的排版结构和呈现方式可能因插入标记而发生变 化;(3)标记信息与具体应用环境相关,不具有通用性,难以被其他工具复用和再加工。 国外针对IE浏览器开发的有IMarkup,Third voice等。Markup支持角色定义, 不同角色采用不同色彩字体显示,并提供检索和过滤功能。Third voice允许用户以"粘贴 笔记"的方式标注到网页。这些标注方式中,标注信息容易被当作垃圾广告而遭过滤。
技术实现思路
本专利技术目的在于针对现有技术的不足,提出一种面向通用浏览器的网页标注系3 本专利技术的技术方案为由以下三个部分组成, (1)标注与标签模块,用于用户针对选中网页内容添加或编辑标注生成信息,标注 生成信息包括有元数据信息、标注信息和标签信息,所述元数据信息用于记载网页属性相 关信息、标注者相关信息和内容属性;所述标注信息包括标注内容和定位信息,定位信息是 定位与显示模块的定位依据;所述标签信息用于指定标注内容在浏览器所提供相应网页中 的呈现样式; (2)存储模块,标注与标签模块所得标注生成信息送入存储模块进行存储; (3)定位与显示模块,用于根据选中网页内容,在浏览器所提供相应网页中定位显 示标注;所述显示标注采用文档内容内嵌方式实现,具体实现过程如下, 结合浏览器中的网页内容的统一地址,从标注与标签模块或存储模块中提取网页 内容相关的标注生成信息;获取浏览器底层的文档类型接口,并通过文档类型接口直接获 取网页内容;根据标注信息中的定位信息,搜索并获取网页内容中被标注及需显示的内容 信息;按标签信息所指定的呈现样式,生成显示标注信息中标注内容的HTML标记文本;用 该HTML标记文本替换被标注及需显示的内容信息,形成更新的、带有标注信息的网页文 档,并通过浏览器显示。 而且,标注与标签模块提供标签模版,按照标签模版分项记载元数据信息、标签信 息和标注信息。 而且,标注与标签模块为l项元数据信息和l项或以上标签信息建立关联,为标签 信息和标注信息建立一一对应关联。 而且,标注与标签模块提供基于浏览器的用户编辑界面,将"标注添加"和"检索与管理"功能按钮通过插件方式嵌入在浏览器工具栏中,从而分别形成标注编辑工具栏和标注检索工具栏;通过用户编辑界面支持实现添加过程、检索过程和管理过程, 所述添加过程为,用户点选"标注添加"功能按钮,浏览器中打开标注编辑工具栏;用户从浏览器所提供网页中选中网页内容,在标注编辑工具栏中填写编辑元数据信息、标注信息和标签信息,完成后在标注添加工具栏选择确认进行添加,填写内容存入存储模块; 所述检索过程为,用户点选"检索与管理"功能按钮,浏览器中打开标注检索工具 栏,标注检索工具栏中提供查看方式的选择;用户在标注检索工具栏中选择查看方式;根 据查看方式从存储模块提取相关标注的记录,在浏览器中呈现包括检索所得记录的页面; 所述管理过程为,在完成检索过程后,用户从包括检索所得记录的页面中点选某 项记录;在浏览器中呈现包括该记录所对应标注的标注生成信息的页面,该页面中提供用 户可选管理操作,包括对该记录的修改、增加、删除和投票操作。 而且,所述添加过程中,用户从浏览器所提供网页中选中网页内容时,标注与标签 模块从网页中提取定位信息并自动填入标注编辑工具栏。 而且,所述定位信息包括选中网页内容所处相应网页的三类信息,即网页地址、网 页中处于选中网页内容前后的词组和HTML标签、网页中选中网页内容所含关键词出现频 度。 而且,所述存储模块采用数据库服务器、USB闪存或硬盘实现。 本专利技术是一种面向通用浏览器的网页标注系统,可以针对不同浏览器提供的网 页,实现标注的添加、编辑和查询等操作;不同于已有的标注技术,如基于代理和增强技术, 本标注技术采用文档内容内嵌技术,添加的标注成为网页文档的内容组成部分,不改变Web 页面的格式、文件结构或显示风格;标注生成信息脱离具体应用环境,可以被其他工具复 用、共享和再加工;标注生成信息可存储到存储服务器或相关硬件设备上。本专利技术可以广泛 应用到PDA、个人电脑、笔记本等设备上。附图说明 图1本专利技术的应用方式示意图; 图2本专利技术的使用过程示意图; 图3本专利技术实施例一的标签模版示意图; 图4本专利技术实施例二的标签实例图; 图5本专利技术实施例三的结构示意图。 所要实现的网页标注系统应用方式参见图l,浏览用户浏览网页,浏览过程中操作 标注工具对网页施加标注,标注相关信息被存入存储服务器或其它硬件,在浏览该网页时 再根据标注相关信息在网页上定位显示。可以设定权限,浏览用户登录存储服务器获得授 权后,才能进行标注操作。本专利技术所指"网页",指不包本文档来自技高网
...

【技术保护点】
一种面向浏览器的网页标注系统,其特征在于:由以下三个部分组成,(1)标注与标签模块,用于用户针对选中网页内容添加或编辑标注生成信息,标注生成信息包括有元数据信息、标注信息和标签信息,所述元数据信息用于记载网页属性相关信息、标注者相关信息和内容属性;所述标注信息包括标注内容和定位信息,定位信息是定位与显示模块的定位依据;所述标签信息用于指定标注内容在浏览器所提供相应网页中的呈现样式;(2)存储模块,标注与标签模块所得标注生成信息送入存储模块进行存储;(3)定位与显示模块,用于根据选中网页内容,在浏览器所提供相应网页中定位显示标注;所述显示标注采用文档内容内嵌方式实现,具体实现过程如下,结合浏览器中的网页内容的统一地址,从标注与标签模块或存储模块中提取网页内容相关的标注生成信息;获取浏览器底层的文档类型接口,并通过文档类型接口直接获取网页内容;根据标注信息中的定位信息,搜索并获取网页内容中被标注及需显示的内容信息;按标签信息所指定的呈现样式,生成显示标注信息中标注内容的HTML标记文本;用该HTML标记文本替换被标注及需显示的内容信息,形成更新的、带有标注信息的网页文档,并通过浏览器显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘清堂杨宗凯黄涛赵刚刘三女牙李新
申请(专利权)人:华中师范大学
类型:发明
国别省市:83[中国|武汉]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1