一种通用web媒体获取与展示的方法技术

技术编号:3541739 阅读:160 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种通用web媒体获取与展示的方法,包含以下步骤:一、获取包含媒体或媒体信息源的网页;二、提取指定Web媒体对象并就地重新组织;三、将指定Web媒体对象展示给客户。本发明专利技术用于在不适合改变媒体显示的宿主或主域的情况下,提供一个稳定、简洁通用的web媒体呈现系统,主要包括媒体查找与媒体组织两个方面。由于本发明专利技术不二次获取网络数据,所以也可以明显减少网络流量,改善系统的反应速度。

【技术实现步骤摘要】

本专利技术属于计算机与应用
,涉及一种网页子内容提取,聚合,重新组织展示的方法,尤其涉及一种通用web媒体获取与展示的方法
技术介绍
WEB媒体,是对互联网络的WEB页面中存在的数据的统称,这包括文本、图片、图像、视频等等,以及这些数据的局部或部分。例如我们说的HTML,全称是“Hyper Text Mark-up Language”(超文本标记语言),而超文本更学术的分类是“html/text”媒体类型;又例如视频流媒体,其实在网络上传输过程的、视频媒体的某个部分。DOM数据分析处理,DOM全称为“Domcument Object Model(文档对象模型)”,是面向HTML组织数据的层次结构进行可编程描述的规范。所谓“可编程描述”,是指用DOM描述的“对象模型(Object Model)”是可以被其它高级语言用在编程环境中的——通常被理解为一个树型结构的对象模型,被称为“DOM树”。而DOM数据分析处理,即是指在DOM的可编程能力范围内,用高级语言对DOM结构中包含的数据信息进行分析处理的方法。媒体获取,是指从一个包含媒体的目标中得到该媒体数据的部分或全部的一个过程。根据媒体源的不同,又可以分为网络获取、本地缓存获取、静态文件获取、数据流内获取、可编程结构内部获取等。例如在互联网络-->中,RSS(Rich Site Summary,丰富站点摘要)技术是一种根据特定协议,从远程网络获取媒体的技术。媒体展示,是指将获得的媒体重新组织并展示在相同的或不同的界面、介质上的技术。例如,利用RSS技术可以从异地获取WEB媒体,并在本地重新组织并展示在一个3D游戏内部物件的材质表面。媒体展示中会遇到宿主与主域的问题。通常宿主是指适合播放该媒体的应用程序或组件,不同的媒体所使用的宿主不同,因此难于使用同一宿主来展示不同媒体;宿主的性质(可控性、安全性)以及操作界面、编程界面也不相同,因此如果使用原宿主来展示该媒体,则既难于通用也难以控制。所谓主域,是浏览器对不同网站/网页的限定,部分媒体在检测到自身被跨域访问时将不能正常显示。传统的web内容获取查询方式有三种:一是用户进入网站搜索或者选择对应连接,然后在返回新页面中才可能是自己需要的内容;二是网站作为中间代理为用户搜索特定范围的内容,在服务器端重新组织并显现为新的网页结构;三是软件商发布桌面应用软件产品,由该软件从网络中获取数据并在本地(用户的桌面环境中)显示。这些方法浪费了大量的网络带宽,内容杂乱或冗余(部分并不是用户需要媒体内容)。现有web媒体数据获取和展示技术大多只能对特定的内容信息处理,无通用性,例如RSS阅读器只能处理RSS格式的网络信息。而实际用户通常对获取图形、视频、Flash等内容有更多的需求。处理这些复杂的、非格式化的或流数据形式的网络媒体,对传统的技术方案而言是一个重大的疑难。-->
技术实现思路
本专利技术要解决的技术问题是提供一种通用web媒体获取与展示的方法,可有效避免媒体数据对网络域检测的限制,可明显减少网络流量,改善系统的反应速度,适用于不同内容的网站。为解决上述技术问题,本专利技术一种通用web媒体获取与展示的方法,包含以下步骤:一、获取包含媒体或媒体信息源的网页;二、提取指定Web媒体对象并就地重新组织;三、将指定Web媒体对象展示给客户。步骤一具体为:从Web上通过支持DOM的浏览器或浏览器控件获取网页;或通过HTTP协议直接获取该网页并在一个支持DOM/XML(XML是eXtensible Markup Language的缩写,它是一种可扩展性标识语言,能够让你自己创造标识,标识你所表示的内容;DOM全称是Document ObjectModel(文档对象模型),定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式;XML创建了标识,而DOM的作用就是告诉程序如何操作和显示这些标识。)解析的渲染引用中分析。步骤二具体包括:A、从上述结果中得到DOM树;B、从DOM树中找到指定的Web媒体对象,返回该媒体的唯一标识;C、根据唯一标识,从DOM树中清除或隐藏上述Web媒体对象之外的其它媒体。步骤B中所述从DOM树中找到指定的Web媒体对象,是采用某种既定描述规则的方法。-->步骤三具体为:调整上述Web媒体对象的展示属性,使其符合展示需求进行展示。本专利技术的有益效果在于:本专利技术一种通用web媒体获取与展示的方法,用于在不适合改变媒体显示的宿主或主域的情况下,提供一个稳定、简洁通用的web媒体呈现系统,主要包括媒体查找与媒体组织两个方面。由于本专利技术不二次获取网络数据,所以也可以明显减少网络流量,改善系统的反应速度。采用本专利技术技术方案,可以在不改变媒体对象所在的宿主页面,以及所在的主域设置的情况下,使一个复杂的网页页面变成展示唯一媒体元素的(亦或称之为该媒体元素及其展示环境的)一个独立对象。这样的一个复合体,可以直接用于更复杂的界面组织——例如在界面中重新布局、显示或设计控制界面,而不会影响新的界面的可操作性。采用本专利技术技术方案,网站设计人员可以在不增加成本、不重构网页的情况下重新组织资源,或者联合不同的网站。这是组织大型网络或提供复杂网络服务的基本要求,因此本专利技术具有相当明显的实用性。采用本专利技术技术方案,网页或网页媒体可以在不考虑具体媒体展示方法、控制方法以及权限与系统安全设置的情况下,有效地使用该媒体对象。除了这种应用环境之外,一些客户端程序(例如操作系统的桌面应用)也可以使用该技术方案将Web网站与桌面服务提供联合起来:例如在对服务器设计没有变更和技术要求的情况下,将Web媒体展示移植或嵌入到客户端程序中。附图说明-->图1是传统的媒体获取与展示的方法流程图;图2是本专利技术一种通用web媒体获取与展示的方法流程图;图3是本专利技术实施例中的DOM结构示意图;图4是本专利技术中媒体展示方法的流程图。具体实施方式下面结合附图和实施例对本专利技术作进一步详细的说明:一、基本媒体类型与媒体处理框架根据宿主与主域的限制,可以将媒体分为如下类型:传统处理方法将媒体或媒体信息提取出来做二次展示,其步骤如图1所示。图1中所谓“规则”是指对媒体信息格式的规则化描述,所谓“策略”是指媒体到媒体内容之后,用于存储、表现或其它功能的、可变的处理逻辑。传统处理方法因为存在“提取内容并存储后进行重新组织”的二次展示过程,所以对上表中后三种媒体的处理都存在或多或少的问题。本专利技术采用不改变宿主、主域的“就地展示”方式,从根本上避免了上述问题。其步骤如图2所示,由于规则、策略直接作用于提取与组织内容的子系统,提取内容并就地重新组织,而不是象传统处理方法一样在提-->取内容的同时需存储内容,然后再重新组织,从而会影响存储中的内容,因此本专利技术也能适用于没有本地存储或远程存储能力的客户端应用,例如Web富客户端应用(Rich Web Client)。二、媒体获取的基本方法下面以一个规则为例来说明获取媒体的方法。例如:[get_from_web_source]srcHttp=http://domain/aPage.htmlskipObject=2getNmb=1incObject=swf为了下文的描述方便,假设从指定sr本文档来自技高网
...

【技术保护点】
一种通用web媒体获取与展示的方法,其特征在于,包含以下步骤: 一、获取包含媒体或媒体信息源的网页; 二、提取指定Web媒体对象并就地重新组织; 三、将指定Web媒体对象展示给客户。

【技术特征摘要】
1、一种通用web媒体获取与展示的方法,其特征在于,包含以下步骤:一、获取包含媒体或媒体信息源的网页;二、提取指定Web媒体对象并就地重新组织;三、将指定Web媒体对象展示给客户。2、根据权利要求1所述的通用web媒体获取与展示的方法,其特征在于,步骤一具体为:从Web上通过支持DOM的浏览器或浏览器控件获取网页;或通过HTTP协议直接获取该网页并在一个支持DOM/XML解析的渲染引用中分析。3、根据权利要求1所述的通用web媒体获取与展示的方法,其特征在于,步骤...

【专利技术属性】
技术研发人员:陈少坡
申请(专利权)人:盛乐信息技术上海有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1