使用集群进行自动化文档构成制造技术

技术编号:10407624 阅读:98 留言:0更新日期:2014-09-10 17:11
公开了使用集群进行自动化文档构成的系统和方法。在示例中,方法包括:确定多个构成分数,所述构成分数均在所述集群中的多个工作者节点上分别计算。所述方法还包括:基于来自工作者节点中的每一个的构成分数在集群中主节点处确定系数。所述方法还包括:使用所述系数输出最优文档(D*)。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】公开了使用集群进行自动化文档构成的系统和方法。在示例中,方法包括:确定多个构成分数,所述构成分数均在所述集群中的多个工作者节点上分别计算。所述方法还包括:基于来自工作者节点中的每一个的构成分数在集群中主节点处确定系数。所述方法还包括:使用所述系数输出最优文档(D*)。【专利说明】使用集群进行自动化文档构成
技术介绍
个体出版(micro-publishing)在互联网上已经蓬勃发展,这由博客和社交网站点的数量的惊人增加所证实。个性化的内容允许出版者针对读者(或订阅者)瞄准内容,允许出版者聚焦在广告上,并且把这个增加的价值作为奖励。但尽管这些出版者可能具有所述内容,但是他们通常缺乏设计技能以创建引人注目的印制杂志,并且通常不能够负担得起专业图形设计。手工出版物设计是精深的专业技术,从而增加每个新版本的最低限度的设计成本。仅拥有少数的订阅者并不能作为设计成本高的合理理由。而且即使在大量订阅者基础的情形下,大规模出版者能够发现:对于所有订阅者,手工设计个性化出版物也是经济上不可行且运销上(1gistically)是困难的。自动化文档构成系统可以是有益处的。【专利附图】【附图说明】图1示出了混合内容文档的单个页面的模板的示例。图2示出了两个图像被选择以便在图像区域中显示的图1中的示例性模板。图3A是示出了使用PDM的自动化文档构成的示例性实现方式的高层面示图。图3B是示出了示例性模板库的高层面示图。图4A-D示出了示出了模板库中的示例性可变模板。图5是服务器集群中的示例性自动化文档构成的高层面图示说明。图6是示出了可以被实现以在服务器集群中自动化文档构成的示例性硬件的高层面框图。图7是示出了用于在服务器集群中自动化文档构成的示例性操作的流程图。【具体实施方式】对于个体出版者、甚至大规模出版者,自动化的文档构成是令人注目的解决方案。在减小设计和布局用的时间和相关联的成本时,二者得益于能够提供高质量、个性化的出版物(例如,报纸、书籍、和杂志)。此外,出版者不需要具有任何特定级别的设计专业技术,使得个体出版革命能够从严格地“在线”转移到多个传统的印制出版物。用于在线和传统印制出版物二者的混合内容文档典型地被组织成显示元素的组合,所述元素被定尺寸和布置来以条理分明、见闻广博、且视觉美感的方式向读者显示信息(例如,文本、图像、标头(header)、边条(sidebar))。仅举几个例来说,混合内容文档的示例包括:文章、传单、业务名片、时事通讯、网站展示、宣传册、单页面或多页面广告、信封和杂志封面。为了设计混合内容文档的布局,文档设计者为文档的每个页面选择:多个元素、元素尺寸、称作“空白空间”的元素之间的间隔、文本的字体大小和类型、背景、颜色、和元素的其他布置。因为对于出版文档的人类审美感知没有已知通用的模板,故以审美愉悦的方式在多个页面上布置变化尺寸、数量和逻辑关系的元素可能是具有挑战的。即使出版文档可以在质量上被评分,但计算使审美质量最大化的布置的任务是页面数量的指数并且通常被认为是难以处理的。概率文档模型(PDM)通过允许审美由人类图形设计者编码成灵活的模板并且在使审美意向最大化时有效地计算最佳布局来克服这些典型的挑战。尽管连续PDM的计算复杂度与页面数量和内容单元成线性关系,但对于交互应用,这样的性能是不充足的,其中用户在发出订单之前期望预览,或期望以半自动化的方式与所述布局交互。计算装置的进步已加速基于软件的文档布局设计工具的成长和发展,因此增加了混合内容文档能够被生成的效率。第一类型的设计工具使用一组网格线,其在文档设计过程中能够被看见但对于文档读者不可见。所述网格线被用于在页面上对齐元素,通过使设计者能够在文档内放置元素而对灵活性留有余地,以及甚至允许设计者把元素的部分扩展到指导线的外面,这取决于设计者愿意把多少变化并入文档布局中。第二类型的文档布局设计工具是模板。典型的设计工具向文档设计者呈现多种不同的模板,用以针对每个文档页面来挑选形式。图1示出了混合内容文档的单个页面的模板100的示例。模板100包括两个图像区域101和102、三个文本区域104-106、和标头区域108。所述文本、图像和标头区域由空白空间分隔。空白空间是分隔两个区域的模板的空白区域,诸如,把图像区域101与文本区域105分隔的空白空间110。设计者能够从一组其他模板中选择模板100,输入图像数据以填充图像区域101,以及输入文本数据以填充文本区域104-106和标头108。然而,组织和确定整个文档的总体布局的许多程序继续需要大量的将由文档设计者完成的工作。例如,模板区域的尺寸被固定是通常的情形,这使文档设计者调整图像大小和布置文本以填充特定区域是困难的,从而产生图像和文本溢出、剪切、或其他令人不愉悦的比例的问题。图2示出了模板100,其中两个图像(由虚线框201和202表示)被选择以在图像区域101和102中显示。如图2的示例中所示,图像201和202在图像区域101和102的边界内匹配的不合适。关于图像201,设计工具可以被配置成通过丢弃确定为图像201外围部分的图像而把图像201剪切成在图像区域101的边界内适合,或者设计工具可以尝试通过重新调节图像201的高宽比而使图像201在图像区域201内适合,这导致视觉上令人不愉悦的扭曲图像201。因为图像202在有多余空间的图像区域102的边界内相配,所以把图像202从文本区域104和106分隔的空白空间204和206超越了在模板100中分隔其他元素的空白空间的大小,这导致元素在视觉上分散注意力的不均匀分布。设计工具可以尝试通过重新调节图像202的高宽比对此进行校正以在图像区域102的边界内适合,这也导致视觉上令人不愉悦的扭曲图像202。在此描述的系统和方法使用自动化的文档构成以生成混合内容的文档。自动化的文档构成可被用于把有标记的原始内容转换成审美愉悦的文档。自动化的文档构成可以涉及内容的分页、确定内容块的相对布置和确定内容块在页面上的物理位置。图3A是示出了使用PDM的自动化文档构成的示例性实现方式的高层面示图300。内容数据结构310表示到布局引擎的输入。在示例中,所述内容数据结构是XML文档。在典型的杂志示例中,可以有:文本流、图片流、边条流、醒目引文流、广告流、和它们之间的逻辑关系。出于图示说明的目的,图3A示出了文本块流、图片流和逻辑联接。在图3A中所述的示例的,内容320被从展示325解耦合,这允许除了内容块之外在大小、数量和关系上的变化,并且所述内容320是自动化出版引擎330的输入。添加或删除元素可以通过在XML结构310中添加或删除子树实现。内容修改只不过意味着改变XML叶节点的内容。每个内容数据结构310 (例如,XML文件)与来自模板库345的模板或文档样式表340相耦合。XML文件310内的内容块具有指示类型的属性。例如,文本块可以被标记为头部、子头部、列表、段落、图片说明(capt1n)。文档样式表340定义这些类型的类型定义和格式。因此,所述文档样式表340可以定义使用采用指定字体大小、行间距等的Arial粗字体的头部。不同样式表340把不同的格式应用到相同的内容数据结构310。需要注意的是:类型定义的范围可以限于元素内,使得两本文档来自技高网...

【技术保护点】
使用集群的自动化文档构成的方法,包括:确定多个构成分数,所述构成分数均在所述集群中的多个工作者节点上分别计算;基于来自工作者节点中的每一个的构成分数确定集群中主节点处的系数;以及使用所述系数输出最优文档D*。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:JBA佩雷拉K刘L王N达梅拉文卡塔
申请(专利权)人:惠普发展公司有限责任合伙企业
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1