结构化文档创建装置和结构化文档创建方法制造方法及图纸

技术编号:2887615 阅读:190 留言:0更新日期:2012-04-11 18:40
扫描器部分扫描至少包括一个符号的多个文档,以转换成图像数据。符号识别部分从图像数据中识别出符号。接着,表创建部分创建链接表,其中把包括在一页内的符号对应于具有相同形状符号的其它页。文档创建部分利用链接表,根据HTML创建HTML文档。当单击屏幕上的HTML文档一页上的符号时,可以获得其它的入口。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种结构化文档创建装置,用于创建结构化文档以把原始的即纸件信息处理成电子文档,还涉及一种构造化文档创建方法。本专利技术还涉及一种具有语音数据的文档创建装置,创建附加有语音数据的文档,还涉及一种具有语音数据的文档创建方法。
技术介绍
随着近年来网络技术(以互联网Internet为典型)的发展,可以很容易地从网络上取得信息。尤其是通过基于互联网上使用的HTML(超文本标识语言)描述的结构化,可操作性极佳的浏览器(检索信息的应用软件)变得普及。因此,在个人计算机上,已使用了各种系统,在这些系统中不仅可以构造文档信息,而且可以构造语音和活动视频图像,并存储在输入装置中。在这种情况下,构造化意味着形成链路结构或者分层结构。然而,存在着难以构造的信息,例如图像数据。在大多数情况下,这种信息被处理成一个批文件。构造这种内部图像需要大量的时间。传统上,为了构造纸上描述的现存文档,必须通过例如光学字符识别(OCR)装置把文档转换成字符,或者必须从键盘上输入。这需要人力操作。现存的文档可以通过扫描仪来成象。然而,这难以把图像分割成要构造的一些部分。近年来,例如个人计算机等已成为普及的信息终端,它们具有创建附加有语音数据的文件,以把语音数据链接到该文档上的功能(下文称为具有语音数据的文档)。下面参照附图说明图1描述创建具有语音数据的文档的传统过程的流程图。图1的流程图示出了创建具有语音数据的传统过程的流程。首先,利用键盘的输入操作创建应附加语音数据的文档,或者利用诸如扫描仪等扫描装置扫描文档。然后,把该文档显示在屏幕上(S101)。接着,把屏幕显示改变为语音符号表,利用鼠标点击操作选择连接到语音数据的语音符号(S102)。可以使用事先在系统中输入的语音数据。或者可以使用由话筒新输入的语音数据。接着,把屏幕显示再次改变成目标图像,利用鼠标拖动显示的语音符号的图标,把语音符号粘贴到屏幕上的文档(S103)。如果有要增加的其它语音符号,则重复S102至103的操作(S104)。当把所有语音符号都粘贴到目标图像上后,就完成了具有语音数据的文档,文档创建操作结束。然而,在传统的创建具有语音数据的文档的装置中,操作者必须对应于要增加的语音符号的数量重复S102至S103的操作多次。因此,如果有大量的语音符号,则完成具有语音数据的文档要花费大量的时间。
技术实现思路
考虑到上述问题,创作了本专利技术,本专利技术的第一个目的在于易于把文档构造成图像数据。本专利技术的第二目的在于即使有在大量的语音符号,也可以容易地在短时间内创建具有语音数据的文档。本专利技术提供一种结构化文档创建装置,它包含输入部分,通过扫描包括至少一个符号的原稿获得输入图像数据;符号识别部分,识别包括在图像数据中的符号;表创建部分,创建把特定数据对应于该符号的表;文档创建部分,创建以HTML描述的结构化文档,在该文档中,根据所述表,把符号链接到特定数据上。在本专利技术中,表创建部分使包括在某一原稿的图像数据内的符号对应于至少包括一个符号的其它原稿的图像数据,其它原稿的图像数据中包括的至少一个符号具有一个与包括在与多个原稿相连的某一原稿的图像数据中的符号相同的元素。而且,本专利技术的结构化文档创建装置还可以包含符号删除部分,删除包括在图像数据中的至少一个符号,以便输出;以及打印部分,打印符号删除部分的输出。而且,本专利技术的结构化文档创建部分还可以包含 符号替代部分,用事先存储的其它符号替代符号识别部分识别出的符号,以对应于符号识别部分识别出的符号。而且,在本专利技术的结构化文档创建装置中,文档创建部分可以创建这样的结构化文档,其中,使具有特定含义的符号与特定含义的处理彼此链接,并且,在符号被激活时进行处理之后就获得对链接到该符号的特定数据的入口。而且,在本专利技术中,符号识别部分在图像文件的预定区域内识别符号。利用上述结构的专利技术,符号识别部分从扫描包括符号的原稿获得的图像识别符号。表创造部分创建把特定数据对应于符号的表。文档创建部分创建以HTML描述的结构化文档,其中根据上表把符号链接到特定数据。在结构化文档中,当单击符号时,可以获得到链接的特定数据的入口。特定数据包括例如原稿的图像数据。在这种情况下,当单击某一原稿的符号时,就可以获得到其它原稿的图像数据的入口(跳转),并可以显示该图像数据。这可以容易地把具有印章形成的符号的现存文档转换成结构化文档。而且,本专利技术的结构化文档创建装置包含输入部分,输入扫描原稿获得的图像数据;符号增加部分,向图像数据至少增加一个符号;表创建部分,创建把特定数据对应于符号的表;以及文档创建部分,创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上。利用上述结构的专利技术,字符增加部分把符号增加到用扫描原稿获得的图像数据。表创建部分创建把特定数据对应于该符号的表。文档创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上。这可以容易地把现存文档转换成结构化文档。本专利技术的结构化文档创建装置还可以包含显示部分,显示输入图像数据。利用这种结构,可以一边利用显示部分确认图像数据的内容,一边增加符号。而且,本专利技术提供一种通信装置,包含输入部分,输入扫描至少包括一个符号的原稿获得的图像数据;符号识别部分,识别包括在图像数据内的符号;表创建部分,创建把特定数据对应于符号的表;文档创建部分,创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上;以及传输部分,传输该结构化文档。而且,本专利技术提供一种通信装置,包含输入部分,输入扫描原稿获得的图像数据;符号增加部分,向图像数据至少增加一个符号;表创建部分,创建把特定数据对应于符号的表;文档创建部分,创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上;传输部分,传输结构化文档。而且,本专利技术提供一种结构化文档创建方法,包含下列步骤识别通过扫描至少包括一个符号的原稿获得的图像数据内包括的至少一个符号;创建把特定数据对应于符号的表;以及创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上。而且,本专利技术提供一种创建具有语音数据的文档的装置,包含输入部分,输入扫描原稿获得的具有至少一个语音符号的输入图像数据;识别部分,从图像数据识别语音符号;语音存储部分,存储语音数据;以及表创建部分,创建把识别出的语音符号对应于存储的语音数据的表。利用上述专利技术,可以从事先加入了语音符号的原稿中创建具有语音数据的文档。因此,即使有大量的语音符号,也可以在短时间内容易地增加所有语时符号。在本专利技术中,表创建部分可以使不同的语音符号对应于每种语音数据。利用这种结构,用户可以从语音符号的形状可视地确定语音数据的种类。而且,本专利技术提供一种创建具有语音数据的文档的方法,包含下列步骤扫描具有至少一个语音符号的原稿;以及从扫描的文档识别语音符号,其中,当识别出的符号和语音数据彼此链接,并且选择了屏幕上的语音符号时,创建具有要再现的语音数据的文档。附图概述图1是创建具有语音数据的文档的传统的过程的流程图; 图2是本专利技术第一至第三实施例共用的装置的框图;图3A至3E是本专利技术第一至第三实施例共用的文档样本的视图;图4是根据本专利技术第一实施例的创建符号表和链接表的操作的流程图;图5续图4的流程图;图6是根据本专利技术第一实本文档来自技高网
...

【技术保护点】
结构化文档创造装置,包含: 输入部分,输入由扫描至少包括一个符号的原稿所获得的图像数据; 符号识别部分,识别包括在图像数据中的符号; 表创建部分,创建使特定数据对应于所述符号的表;以及 文档创建部分,创建以HTML描述的结构化文档,其中根据所述表把所述符号链接到所述特定数据上。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:坂东达夫加藤周奥富浩司丰田清
申请(专利权)人:松下通信系统设备株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1