翻译文档图像生成装置和翻译文档图像生成方法制造方法及图纸

技术编号:2929907 阅读:164 留言:0更新日期:2012-04-11 18:40
翻译文档图像生成装置、记录介质以及翻译文档图像生成方法。该翻译文档图像生成装置具有:提取部分、翻译部分以及区域回填部分。该提取部分提取要处理的像素组,该像素组具有用于构成字符或字符串的像素。该翻译部分翻译该字符或字符串。该区域回填部分回填所提取的像素组,以保持所翻译的字符或字符串的背景,并写入所翻译的字符和字符串。

【技术实现步骤摘要】

本专利技术涉及用于翻译位图化文档的技术。
技术介绍
目前,为了扫描纸介质上的文档并将该文档优化处理为文档数据,已经提出了多种技术。例如,日本专利申请特开公报H05-274397公开了在扫描文档中执行字符识别,并且在对该数据的内容进行适当修改之后,在远程装置之间交换数据的技术。另外,日本专利申请特开公报2002-108855公开了即使在包括地图、插图等的文档的一部分中,也能以高精度识别字符的技术。过去,已进行了以下尝试仅利用翻译为另一种语言的新字符替换文档的字符部分,同时通过在像素级改变通过扫描该文档而获得的文档数据,来保持构成该文档的背景的颜色、图案等外观。通常,将文档数据设置为位图,其中通过多对像素位置和像素值来显示扫描文档的内容。因此,当在位图内的区域中的原样添印通过翻译书写在该区域中的字符而获得的新字符时,如图4(A)所示,由于添印字符位于最初书写的字符的上面,所以其易读性明显下降。另一方面,如果在将构成最初存在的字符的像素的像素值设置为白色之后写入新字符,则肯定可以避免字符的堆叠。然而,即使采用了这种方法,当将文档的背景绘制为白色以外的颜色或图案时,如图4(B)所示,该字符的白色轮廓残留在文档的背景中,以上述相同的方式降低了可读性。鉴于以上情形提出了本专利技术,并且本专利技术提供了一种构造,利用该构造可以仅使用翻译为另一种语言的新字符来替换文档的字符部分,同时保持构成该文档的背景的颜色、图案等外观。
技术实现思路
根据本专利技术的一个方面,提供了一种翻译文档图像生成装置。该翻译文档图像生成装置具有提取部分、翻译部分以及区域回填部分。该提取部分提取要处理的像素组,该像素组具有用于构成字符或字符串的像素。该翻译部分对该字符或字符串进行翻译。该区域回填部分对所提取的像素组进行回填,以保持所翻译的字符或字符串的背景,并且书写所翻译的字符或字符串。根据本专利技术的实施例,可以仅使用翻译为另一种语言的新字符来替换文档的字符部分,同时保持构成该文档的背景的颜色、图案等外观。附图说明下面将根据以下附图详细说明本专利技术的实施例,附图中图1是翻译文档图像生成装置的硬件结构图;图2(A)、2(B)、2(C)、2(D)和2(E)表示位像的变换;图3是(变型例中的)翻译文档图像生成装置的硬件结构图;以及图4(A)和4(B)示出了传统技术。具体实施例方式以下说明根据本专利技术的实施例。在本实施例中,在通过扫描其中在单色纸上印刷黑色文本的文档而获得的位像中识别出字符之后,在使用属性与纸相同的像素回填构成该字符的像素之后,书写新的翻译字符。图1是表示根据本实施例的翻译文档图像生成装置的硬件结构的框图。如图1所示,翻译文档图像生成装置1配备有文档图像数据输入部分10、字符部分图像提取部分11、字符识别部分12、翻译部分13、字符图像数据生成部分14、背景图像提取部分15、字符部分图像删除部分16、回填部分17、图像写入部分18,以及文档图像数据输出部分19。文档图像数据输入部分10将文档的位像输入到装置1本身中。经由该文档图像数据输入部分10输入的位像具有多个配对,这些配对包括表示构成文档图像的像素的位置的地址和将这些像素的属性表示为RGB 256级的RGB值。例如,当特定地址的像素为白色时显示(0,0,0)的RGB值,而当特定地址的像素为黑色时显示(255,255,255)的RGB值。字符部分图像提取部分11从通过文档图像数据输入部分10输入的待处理的位像中的各种书写矩形区域当中指定一个矩形区域(下文中,将待处理的矩形区域称作“处理目标区”),并向背景图像提取部分15和字符部分图像删除部分16提供表示所指定的处理目标区的位置的位置信息。另外,该字符部分图像提取部分11提取构成该处理目标区域中的字符的像素组。根据由字符部分图像提取部分11提取的像素组,字符识别部分12识别通过该像素组显示的字符,并向翻译部分13提供所识别的字符的字符编码。翻译部分13对从字符识别部分12提供的字符编码进行翻译并获得新的字符编码,然后将新获得的字符编码提供给字符图像数据生成部分14。例如,当从字符识别部分12提供了拉丁字符“A”的字符编码时,将日文平假名字符“あ”提供给字符图像数据生成部分14。字符图像数据生成部分14产生与从字符识别部分12提供的字符编码相对应的图像数据,并将该字符图像提供给图像写入部分18。在位像中指定了由字符部分图像提取部分11提供的位置信息表示的处理目标区域之后,背景图像提取部分15提取构成该区域内的字符的背景的像素的RGB值。另一方面,在位像中指定了由字符部分图像提取部分11提供的位置信息所表示的处理目标区域之后,字符位置图像删除部分16将构成该区域内的字符的背景的像素的RGB值重置为白色(0,0,0)。然后,回填部分17将与由背景图像提取部分15提取的相同的RGB值和由字符部分图像删除部分16重置的像素地址重新进行关联。因此,使用RGB值与构成背景的像素相同的像素替换构成处理目标区域中的字符的像素,并且通过颜色与背景相同的像素遮蔽该处理目标区域内的区域。图像写入部分18将由字符图像数据生成部分14提供的字符图像填充在由回填部分17进行了处理的处理目标区域中。当从文档图像数据输入部分10输入包含多个字符的位像时,将书写有各个字符的区域作为处理目标区域,并重复由上述处理部分执行的处理。因此,获得了显示该翻译文档的新位像。经由文档图像数据输出部分19将新获得的位像输出至外部打印装置。下面作为示例,参照图2具体说明通过上述处理部分执行的处理实现的文档位像的变换。图2(A)示出了从文档图像数据输入部分10输入的位像。如图2(A)所示,在该位像中,拉丁字符“A”由黑色像素(RGB值255,255,255)组绘制,而该字符的背景由蓝色像素(RGB值0,255,0)绘制。图2(B)示出了由字符部分图像提取部分11进行了处理之后的位像。在该阶段,将写有该拉丁字符“A”的矩形区域指定为处理目标区域X,并将由该处理目标区域X内的黑色像素组表示的字符“A”的字符编码从字符识别部分12提供给翻译部分13。图2(C)示出了由字符部分图像删除部分16进行了处理之后的位像。在该阶段,通过将构成该拉丁字符“A”的像素的RGB值设定为白色,从处理目标区域X中以白色切除字符“A”。图2(D)示出了由回填部分17进行了处理之后的位像。在该阶段,通过将由背景图像提取部分15提取的背景RGB值与重置像素的地址重新进行关联,使用背景色遮蔽整个处理目标区域X。图2(E)示出了由图像写入部分18进行了处理之后的位像。在该阶段,将通过翻译而获得的日文平假名字符“あ”的图像重新写入处理目标区域X的大致中心位置。新写入的字符是由字符图像数据生成部分14根据由翻译部分13提供的字符编码而生成的。在从输入位像的处理目标区域中识别出字符之后,上述翻译文档图像生成装置1在使用与背景相同的颜色回填写有该字符的区域的像素之后写入新的字符图像,该新的字符图像是通过翻译而获得的。因此,可以避免由于源文档的背景色的某些影响而导致的书写字符的可读性下降。 本专利技术的多种变型例也是可行的。上述实施例是假设在其中输入位像中的字符的背景为单色的情况下构造的,其并不适用于翻译其中在纸上预印刷有图案的文档。另一方面本文档来自技高网...

【技术保护点】
一种翻译文档图像生成装置,其包括:提取部分,用于提取要处理的像素组,该像素组具有用于构成字符或字符串的像素;翻译部分,用于翻译所述字符或字符串;以及区域回填部分,用于回填所提取的像素组,以保持所翻译的字符或字符串的背 景,并写入所翻译的字符和字符串。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:越裕木村俊一
申请(专利权)人:富士施乐株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1