内容创建系统和方法技术方案

技术编号:2852879 阅读:112 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及网页的创建和网页的听取。更具体地说,有可能有效且有保证地改善通过合成音频听取网页的可访问性。根据本发明专利技术的内容创建系统(20)包括:数据库(22),用于创建可以通过合成音频来听取的内容,并且存储结构化文档;以及信息处理部件(24),用于从结构化文档创建朗读节点串(18),并且计算从朗读节点串(18)的音频合成的开始时刻到作为合成音频输出各个节点的时刻的到达时间。信息处理部件(24)包括支持处理部件(36),以便确定对应于到达时间的图形显示,并且使显示部件(26)的屏幕可视地显示基于音频合成到预定节点的到达时间。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及创建网页和该网页的语音浏览,特别涉及一种用于通过合成语音来改善用户对内容的可访问性的内容创建系统、内容创建方法、用于执行上述内容创建方法的程序、存储了上述程序的计算机可读存储介质、图形用户接口系统、以及显示控制方法。
技术介绍
近年来,随着网络技术和因特网基础设施变得普及,计算机用户必须通过因特网在计算机屏幕上可视地显示网页并且获得各种信息。在现有网页创建方法中,首先考虑的是网页向用户可视地提供信息。然而,关于个人计算机中的信息可处理性、信息可获性及其快速性,旨在提供图形用户接口的现有网页被认为具有各种困难。例如,典型地,网页作为图形用户接口被显示在计算机屏幕上。在这种情况下,不能可视地识别网页的用户(在本专利技术中,以下被称作非视觉访问用户)不能充分地访问作为网页而显示的图形用户接口,或者根本无法对其进行任何访问,从而可能产生这样的缺点,即非视觉访问用户不能获得重要内容,例如通过网页所提供的主要内容。如上所述,从非视觉访问用户的视点考虑现有网页的可用性,很难说现有网页具有足够的可访问性。其原因可能包括,例如,非视觉访问用户不能通过使用指针和图标来直接访问内容,其中,通过指针装置如鼠标、输入笔、键盘操作和游戏棒来控制该指针和图标的位置,并且将其显示为诸如箭头等的形状;二维到一维的空间识别完全不同于视觉访问用户的空间识别;以及即使重要的主要内容被高亮显示,它也不能被非视觉访问用户识别,等等。为了即使部分地改善上述缺点,传统地,已经提出了语音响应系统,其通过语音合成系统将结构化文档例如文本、HTML(超文本置标语言)、DHTML(动态超文本置标语言)、SGML(标准通用置标语言)和XML(可扩展置标语言)生成为语音,并且通过麦克风将其提供给非视觉访问用户。然而,仅仅通过语音导航存在这样的缺点,即它不能确保主要内容的可获性,这是因为上述用户需要花费很长时间才能到达显示在网页上的内容中的主要内容,或者因为用户最终不能到达所需内容。另外,为了上述目的,在语音浏览系统、语音响应系统等中,使用VoiceXML等来创建包括适于每个系统的内容的网页,以便提供服务。然而,由于在这样的服务中仅仅提供有限的信息,因此该系统不能使万维网上的大量信息可被非视觉访问用户有效地获得。对于非视觉访问用户,在传统上提出的语音浏览系统通过在用户场所处安装的语音浏览器或屏幕阅读器,使用相同于普通用户所使用的浏览器(Internet Explorer或Netscape Navigator)来访问网页。传统的语音浏览系统通过仅仅提取可通过语音输出的文本信息以及例如从其开头顺序地朗读包括词如“HTML”的文件,向用户提供了语音导航。因此,可能存在这样的缺点,即对于传统的语音浏览系统访问为可视表示的目的而创建的网页上所显示的信息是十分困难的。例如,如果没有预先准备具有图像数据的数据或到图像数据的链接的相应可替换文本,则这样的数据将会缺少一些其要被朗读的信息。而且,近年来,在网页中,各种信息包括在单个页面中,并且通过各种可视效果如背景颜色或文本颜色来布局。然而,语音浏览系统不能传达诸如高亮显示的可视表示和诸如着色的布局。在这种情况下,如在传统上所公知的那样,对于到主要内容的跳转,如果链接命令被插入在网页的开头,则可显著改善非视觉可访问性。通过选择该链接,跳过存在于网页的开始部分中的“与主要内容具有较少关系”的信息如标题等,从而有可能快速地到达网页中的最重要信息。然而,在目前环境下,很少有网页包括上述命令。另外,例如,存在这样的网页,其中该网页的模板包括用于提示从头进行非视觉访问的结构。然而,因为仅仅存在考虑非视觉访问的链接,所以这没有意义,并且在每个内容创建者没有完全描述每个网页上的链接的情况下不能实现其目的。在目前环境下,通常情况是被提供了到主要内容的链接的网页没有该链接自身的描述,从而这样的网页不能完全实现提供链接的功能。因此,也是可知的是,即使输入对用于非视觉访问的链接执行非视觉访问的请求,也存在这样的问题,即用户被返回到网页的开头,或者由于写入了跳转目的地的错误URL而导致发生错误。如果上述用于非视觉访问的链接不能正确工作,则它甚至可能降低可访问性。本质上,可以认为上述缺点起因于视觉访问用户创建网页的事实。在此,在本专利技术中,视觉访问用户是指能够可视地识别网页以便输入并获得信息的计算机用户。换句话说,由于视觉访问用户能够毫无麻烦地使用普通浏览器软件来查看网页,因此可以认为他几乎没有通过语音合成来访问网页的经验。因此,在某种意义上,视觉访问用户很自然地意识不到在语音浏览系统中经常出现的缺点。虽然创建目前可被认为满足视力受损人员需要的所有万维网内容是困难的,但是随着近年来网络技术如因特网变得普及,鉴于可以在因特网上获得甚至重要信息这一事实,因此期望通过改善对现有万维网内容的语音导航来改善对主要内容的可访问性。然而,基于为非视觉访问用户改善可访问性的必要性和重要性,如果有可能更有效地支持处理网页的修改以便由非视觉访问用户访问的主页创建者的工作,就可以认为大幅度地改善可能成为网页创建者的视觉访问用户的任务。
技术实现思路
本专利技术是鉴于现有技术的上述问题而提出的,并且基于这样的概念而提出,其中,如果有可能向视觉访问用户可视地提供针对非视觉访问用户的可访问性,则有可能让作为视觉访问用户的主页创建者或网页创建者容易地向非视觉访问用户提供具有改善可访问性的网页。在本专利技术的网页创建中,为了上述目的,如果以正常的语音速度执行语音合成,则计算到结构化文档中的节点的到达时间,并且将该到达时间与网页上该节点的显示位置相关联,然后向主页创建者或网页创建者可视地显示。在本专利技术的一个具体实施例中,到内容的到达时间可以通过语音合成软件中的正常词语音速度以及采用适当描述语言如文本、HTML、DHTML、SGML和XML的直到指定上述内容为止的词数来估算。另外,向所估算的到内容的到达时间分配对应于到达时间的显示格式,并且例如将其显示在正被创建的网页或主页的屏幕显示上。主页或网页的创建者可以利用屏幕上的显示来估计非视觉访问用户的访问。另一方面,在本专利技术提供的内容创建系统中,不是以根据预定规则从结构化文档的DOM树结构获得的语音节点系列的顺序来发送通过由主页或网页的创建者(在本专利技术中,以下被简称为创建者)参考图形显示而确定的节点,而是响应于创建者的输入而对其进行编辑,并且将其发送到非视觉访问用户的语音合成系统。所发送的结构化文档通过语音合成系统以由创建者指定的顺序重新生成语音节点序列,并且作为合成语音将其提供给非视觉访问用户。在本专利技术的一个具体实施例中,有可能可以通过在非视觉访问用户场所处安排的用户终端以由创建者指定的顺序来导航网页,而无需较大地改变网页的可视配置,也就是,例如为视觉访问用户保持网页的相同可视显示。此外,在本专利技术中,还有可能使用和修改曾经创建的网页或主页,并且还有可能通过准备几种语音速度和语音导航来针对熟悉语音浏览的非视觉访问用户和不熟悉语音浏览的非视觉访问用户容易地提供不同的可访问性。具体地说,根据本专利技术,提供了一种用于创建可以通过合成语音来查看的内容的内容创建系统,该内容创建系统包括数据库,用于存储结构化文档;以及信息处理部件,用于从结构化文本文档来自技高网
...

【技术保护点】
一种内容创建系统,用于创建可以通过合成语音来查看的内容,包括:数据库,用于存储结构化文档;以及信息处理部件,用于从所述结构化文档创建语音节点系列,并且计算从开始语音节点系列的语音合成直到作为合成语音输出每个节点为止的到达时间 。

【技术特征摘要】
【国外来华专利技术】JP 2003-4-30 125147/20031.一种内容创建系统,用于创建可以通过合成语音来查看的内容,包括数据库,用于存储结构化文档;以及信息处理部件,用于从所述结构化文档创建语音节点系列,并且计算从开始语音节点系列的语音合成直到作为合成语音输出每个节点为止的到达时间。2.根据权利要求1所述的内容创建系统,其中,所述信息处理部件包括支持处理部件,其用于编辑所述语音节点系列和所述结构化文档中的对应部分。3.根据权利要求2所述的内容创建系统,其中,所述支持处理部件包括到达时间计算装置,用于计算从创建语音节点系列直到执行预定节点的语音合成为止的到达时间;转换确定装置,用于响应于到达时间而修改所述预定节点的显示位置处的图形显示,并且接收用于指示修改到预定节点的到达时间的修改命令;以及转换装置,用于从所述转换确定装置接收输出,创建并且向外界输出时间显示映射表。4.根据权利要求3所述的内容创建系统,其中,所述时间显示映射表包括所述节点、对应于所述节点的到达时间、所述节点的显示位置、以及所述节点的图形显示值。5.根据权利要求3所述的内容创建系统,其中,所述转换确定装置包括用于接收用来指示修改到预定节点的到达时间的修改命令,并且在所述修改命令所指定的节点的紧邻前面位置处修改语音节点系列和结构化文档。6.一种计算机可执行的内容创建方法,用于使计算机创建可以通过合成语音来查看的内容,所述方法包括以下步骤读取存储在数据库中的结构化文档;从所述结构化文档创建语音节点系列;存储步骤,计算从开始语音节点系列的语音合成直到执行预定节点的语音合成为止的到达时间,并且将所述节点与到达时间关联以存储它们;以及读取所述到达时间,并且向显示部件提供与所述节点的到达时间对应的图形显示。7.根据权利要求6所述的内容创建方法,其中,所述存储步骤还包括以下步骤对于所述节点,将所述节点的显示位置与所述节点的图形显示值相关联以存储它们。8.根据权利要求6所述的内容创建方法,其中,提供所述图形显示的步骤包括以下步骤根据到达时间在所述节点的显示位置处修改图形显示。9.根据权利要求8所述的内容创建方法,其中,根据到达时间修改所述图形显示的步骤包括以下步骤接收用于指示修改到预定节点的到达时间的修改命令;响应于所述修改命令,修改语音节点系列和对应的结构化文档;重新计算所述修改的语音节点系列中的到达时间;以及根据重...

【专利技术属性】
技术研发人员:高木启伸浅川智惠子
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利