从电子文档组装、提取和配置内容的方法和装置制造方法及图纸

技术编号:2824024 阅读:165 留言:0更新日期:2012-04-11 18:40
本发明专利技术的实施方式允许从电子文档得到的内容要素部件的聚集的说明和服务。并入的内容要素部件可以对应于任何可访问文档的任何要素部件。在各个实施方式中,从源文档的目标布局得出的信息被用来创建要素部件的说明。所述说明可以包括搜索条件。可以采用图形方法来构建所述说明。本发明专利技术的实施方式使得内容聚集能够出现在显示呈现上,该显示呈现的布局可以适应于不同的级别。在各个实施方式中,为内容聚集的显示呈现采用了灵活的内容移动方法。结果是,可以在不浪费下载带宽和显示屏幕实际使用面积的情况下,实现移动设备和其他设备上的内容聚集的显示。

【技术实现步骤摘要】
【国外来华专利技术】本申请是2005年8月9日提交的题为“METHODS AND APPARATUSTO SERVICE PERSONALIZED AGGREGATIONS OF WEB CONTENT”的临时申请60/706,734的非临时申请,并且要求60/706,734号申请的优先权。
本专利技术的实施方式涉及数据处理领域,具体地说,涉及对来自电子文档的内容进行组装、提取和配置的工具、方法和系统。
技术介绍
尽管在过去的数十年取得了显著的进步,电子文档技术仍然具有很多缺点,这些缺点阻止了用户完全意识到计算和相关技术的进步带来的益处。超文本标记语言或级联样式表(HTML/CSS)提供了将来自万维网上任何地点的图像文件和视频文件等的内容组装成Web页面或帧的工具。典型地由结合了与HTML/CSS相关的布局规则的Web浏览器来管理Web页面和帧的显示。使用服务器页面技术将Web上的很多动态内容组装到模版中。服务器页面技术还允许来自各种源的内容片段的组装。各种Web站点使用HTML/CSS提供的工具并通过诸如Javascript之类的脚本语言,在内容项目集的指定位置中使可见性循环,或者在单个内容项目的各个要素之间在指定位置中移动可视性。非常有限的下载带宽和与移动设备相关的屏幕实际使用面积已经成了创建WAP(无线接入协议)网络的动机。因为建立WAP站点是极需要劳力的,和万维网相比,WAP网络非常小,相应地提供给用户的内容-->也较少。出于搜索的目的,与WAP网络相比,万维网是更加强大的源。有限的下载带宽和有限的屏幕实际使用面积还推动了对移动设备上呈现的HTML文件进行重新格式化的浏览器的创建。这种移动浏览器对内容进行重新格式化,以减少水平滚动操作。它们可以向长的页面引入页面分割。它们可以移除或替换对大文件的引用。它们可以替换字体。它们还提供不同的用户界面。还通过服务器转码器提供类似的功能,所述服务器转码器截取用户对HTML文件的请求。这种服务器转码器可应用于对满足搜索标准的Web页面进行重新格式化。当前的移动浏览器和服务器转码器基于有限范围的简单标准,至多提供初步的内容提取工具。真正简单整合(RSS)源(feed)是Web页面要素(constituent),典型地每个要素占用了总的Web页面区域的很小比例。RSS源包括与其他Web站点的随时间变化的链接,具有与该链接相关的内容项目的简单描述。软件工具(“刮刀(scrapers)”)可用于从Web页面自动地产生RSS源。刮刀识别这些Web页面上的链接要素。与前些日子的Web中可用的工具相比,与诸如XPath、XQuery、XPointer以及XLink之类的XML(扩展标记语言)相关的标准和推荐标准为访问内容提供更强大的工具。然而,即使当内容源使用相同语言的相同的语调,且即使该内容源具有十分相似的内容,该内容源在它们怎样表现内容方面可能极大地不同。XPath、XQuery和类似技术的有效使用要求知道内容在特定源怎样表达的详细知识。使用这些技术,如果从大量的潜在源抽取内容,可能需要不切实际的庞大的复杂代码。某些Web站点从其他Web站点聚集内容。例如,一个新闻聚集Web站点包括来自各个Web新闻站点的随时间而变的标题。当链接到源站点上的相关文章时,这些标题变成2倍大。这些Web站点上可用的动态内容受限于固定的项目表,用户从所述项目表中选择他们希望观看的项目。某些Web站点允许用户在极其受限的限定中个性化信息的组装和显示。例如,用户可能能够选择他/她希望在他/她的个性化页面中包括哪些RSS源。用户还能够指定RSS源到显示栏的分配、栏目本身的布置、诸如字体和颜色之类的图形处理以及其他微小的显示变化。-->不管是独立地还是一起采用,这些技术不能完全支持对来自电子文档的内容进行灵活的组装、提取和/或部署,其中内容项目本身(与内容项目的链接相对)出现在用户的显示上,其中内容项目不需要直接对应于任何现有的链接,其中内容项目不需要对应于页面或帧,且其中内容项目可以从总体上包含公共Web的任何源提取。无论是独立地还是一起采用,这些技术不能完全支持对灵活提取的内容聚集体(contentaggregation)。无论是独立地还是一起采用,这些技术不能完全支持用于能够方便地观看大量变化内容的显示的内容组织,同时屏幕实际使用面积的使用被基本最小化,同时带宽的使用被基本最小化,且同时诸如滚动条之类的屏幕平移机制的使用被基本最小化。用于显示的内容的这种灵活的组装、提取和组织对于移动设备是尤其需要的。无论是独立地还是一起采用,这些技术不能提供用于指定需要从各种源组装、提取和/或组织的预期内容的图形方法。无论是独立还是一起采用,这些技术不提供用于在内容的直观人类感受与标记语言中的内容表达细节之间进行调和的有效、高效且易于使用的工具。附图说明图1例示了根据各个实施方式的本专利技术的内容组装、提取和部署方法和装置的概览;图2例示了显示Web内容的个性化聚集体的示例性显示页面;图3例示了显示意在用于移动设备且表征了内容移动的Web内容的个性化聚集体的示例性显示;图4例示了根据各个实施方式的用于构建显示Web内容的个性化聚集体的显示页面的过程;图5例示了根据各个实施方式的适用于实施本专利技术的示例性计算机系统。具体实施方式本专利技术的说明性实施方式包括但不限于从电子文档提取并部署内容-->的方法和装置。将使用本领域技术人员通常采用的术语描述说明性实施方式的各个方面,以向本领域的其他人员传达他们工作的精髓。然而,对于本领域技术人员来说,很明显,可以仅使用某一些所述方面来实践可替换的实施方式。为解释目的,提出了特定的数字、材料和配置以提供对说明性实施方式的彻底理解。然而,对于本领域技术人员而言,很明显,备选实施例可以不使用特定细节来实施。在其他实例中,现有特征被省略或简化以不混淆说明性实施方式。此外,各个操作将以最有助于理解说明性实施方式的方式依次被描述成多个分离的操作;然而,说明的顺序不应被解释为暗示着这些操作必须是依赖于次序的。具体而言,这些操作不需要以表达的顺序进行。短语“在一个实施方式中”被重复地使用。该短语通常并不是指同一实施方式;然而,它可以是指同一实施方式。术语“包含”、“具有”以及“包括”是同义词,除非上下文有其他规定。短语“A/B”意味着“A”或“B”。短语“A本文档来自技高网...

【技术保护点】
一种由计算设备实施的方法,该方法包括:    利用计算设备从用户征求用于多个内容要素部件的多个与特征化相关的输入;    响应于所接收的输入,通过所述计算设备,生成或者使得生成候选内容聚集说明,所述候选内容聚集说明直接或间接地包括多个候选指示,所述候选指示以相应地结合了多个资格的多个合格描述来表征所述要素部件;    对于所生成的候选聚集说明,通过所述计算设备从用户征求反馈;以及    在需要时一次或多次通过所述计算设备修改所述候选聚集说明或重复所述征求和生成,以实现用于请求内容的内容聚集说明。

【技术特征摘要】
【国外来华专利技术】US 2005-8-9 60/706,7341.一种由计算设备实施的方法,该方法包括:
利用计算设备从用户征求用于多个内容要素部件的多个与特征化相
关的输入;
响应于所接收的输入,通过所述计算设备,生成或者使得生成候选
内容聚集说明,所述候选内容聚集说明直接或间接地包括多个候选指示,
所述候选指示以相应地结合了多个资格的多个合格描述来表征所述要素
部件;
对于所生成的候选聚集说明,通过所述计算设备从用户征求反馈;
以及
在需要时一次或多次通过所述计算设备修改所述候选聚集说明或重
复所述征求和生成,以实现用于请求内容的内容聚集说明。
2.根据权利要求1所述的方法,其中所述征求包括通过所述计算设
备,通过呈现的文档、归纳或学习,从所述用户征求所述多个与要素部
件特征化相关的输入。
3.根据权利要求2所述的方法,其中所述征求包括通过所述计算设
备,通过使所述用户识别所呈现的电子文档的要素部件,征求所请求的
要素部件的特征化;且所述生成包括生成用于合格描述的一个或多个资
格以描述所识别的要素部件。
4.根据权利要求3所述的方法,其中所述导出包括通过所述计算设
备测量或者使得测量所识别的要素部件的一个或多个布局资格。
5.根据权利要求1所述的方法,其中所述征求包括通过所述计算设
备,通过使所述用户以图形的方式定义电子文档的要素部件,征求所请
求的要素部件的特征化;且所述生成包括生成用于合格描述的一个或多
个资格以描述所述以图形方式定义的要素部件。
6.根据权利要求1所述的方法,其中所述生成包括从内容聚集说明
库中检索现有的内容聚集说明,且至少部分地基于所检索的现有内容聚
集说明来生成候选聚集说明。
7.根据权利要求1所述的方法,所述方法还包括:所述计算设备帮
助用户创建所请求内容的呈现说明,包括多个显示槽以及所述显示槽的
全部或子集的一个或多个可选择的布置。
8.一种由计算设备实施的方法,该方法包括:
接收内容聚集说明,所述内容聚集说明直接或间接地包括多个指示,
所述指示以相应地结合了多个资格的多个合格描述来表征多个要素部
件;以及
处理至少一个所述指示以简化所述指示,从而直接识别要素部件。
9.根据权利要求8所述的方法,所述方法还包括通过所述计算设备,
在请求时之前,预处理或者使得预处理所述内容聚集说明,以预识别所
述资格,从而减少请求时处理。
10.根据权利要求9所述的方法,其中所述预处理或使得预处理包
括通过所述计算设备访问或者使得访问一个或多个电子文档源,以确定
所述一个或多个电子文档源是否具有包含满足所述预识别的资格的要素
部件的电子文档。
11.一种由计算设备实施的方法,该方法包括:
通过计算设备,接收对包括多个要素部件的内容的请求,所述请求
以内容聚集说明的形式存在,所述内容聚集说明直接地或间接地包括多
个指示,所述指示以多个导出描述来表征所请求的要素部件,每个导出
描述结合了导出资格;
通过所述计算设备,有效地从具有满足所述导出描述的导出资格其
中选择出的导出资格的要素部件的多个电子文档中获得或者使得获得所
请求的要素部件;以及
通过所述计算设备,以所获得的满足导出资格的要素部件响应或者
使得响应所述请求。
12.根据权利要求11所述的方法,其中所述接收包括从耦合到所述
计算设备的客户端设备接收所述请求,所述客户端设备是服务器、桌面
计算设备或移动计算设备之一,且所述响应或使得响应包括向所述客户
端设备提供所获得的满足导出资格的要素部件。
13.根据权利要求11所述的方法,其中至少一个所获得的满足导出
资格的要素部件包括文本、图形、图像、一个或多个视频帧或音频剪辑。
14.根据权利要求11所述的方法,其中所述内容聚集说明包括间接
地指定所述指示的至少一个子集的显著类别名称。
15.根据权利要求11所述的方法,其中至少一个所述指示以一个或
多个导出布局资格来表征所请求的要素部件。
16.根据权利要求15所述的方法,其中至少一个所述导出布局资格
是当电子文档被呈现时的呈现位置、呈现大小、呈现长度、呈现宽度、
呈现高度、呈现像素的数目或电子文档的要素部件的呈现字符的数目。
17.根据权利要求11所述的方法,所述方法还包括,所述计算设备
使用户便于创建直接或间接地具有所述指示的所述内容聚集说明,所述
指示以具有导出资格的导出描述来表征所述要素部件。
18.根据权利要求11所述的方法,所述方法还包括通过计算设备处
理或者使得处理包括所述指示的导出描述的导出资格的所述内容聚集说
明,以识别所请求的要素部件。
19.根据权利要求18所述的方法,其中至少一个指示包括修饰合格
描述的描述修饰语,且所述方法还包括:所述计算设备处理或者使得处
理所述描述修饰语,至少部分地基于所述描述修饰语修饰的合格描述、
根据上下文解释所述说明修饰语。
20.根据权利要求18所述的方法,其中所述计算设备的所述处理包
括通过所述计算设备访问用于分别与一个或多个导出描述术语相关或一
个或多个导出描述类别相关的信息的导出描述库或内容类别库,以协助
所述计算设备处理所接收的内容聚集说明。
21.一种由计算设备实施的方法,该方法包括:
通过计算设备接收用于响应内容请求的多个要素部件,所述内容请
求以直接或间接地包括多个指示的内容聚集说明的形式提出,所述指示
以结合了资格的多个合格描述来表征所述要素部件,且所接收的要素部
件是满足所述资格的电子文档的要素部件;
通过所述计算设备,组织或使得组织所接收的满足资格的要素部件
以用于呈现,包括生成多个聚集调用以呈现所述多个接收的满足资格的
要素部件;以及
通过所述计算设备,利用包含所生成的聚集调用的有组织的满足资
格的要素部件来响应或者使得响应所述请求。
22.根据权利要求21所述的方法,其中至少一个所述聚集调用包括
CS、TP和PR的三角,其中CS识别满足资格的要素部件的源,TP识别
与所述要素部件相关的复杂树图形,及PR识别用于使用所述复杂树图形
呈现所述要素部件的过程,所述复杂树图形包括多个节点以及至少一个
与所述节点耦合的分支,所述节点中的至少一个终端节点包括对应于多
个同胞子树的通配符。
23.根据权利要求21所述的方法,其中至少一个所述聚集调用包括
CS、PE和PR的三角,其中CS...

【专利技术属性】
技术研发人员:塞缪尔S爱泼斯坦
申请(专利权)人:沙力股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1