信息处理设备和信息处理方法技术

技术编号:19550224 阅读:30 留言:0更新日期:2018-11-24 21:44
信息处理设备和信息处理方法。一种信息处理设备包括接收单元、获得单元和翻译单元。所述接收单元接收文档作为要翻译的对象。所述获得单元从所述文档获得非对象区域,该非对象区域是不作为要翻译的对象的区域。所述翻译单元不对所述非对象区域执行翻译,而是对所述非对象区域以外的部分执行翻译。

Information Processing Equipment and Information Processing Method

Information processing equipment and methods. An information processing device includes a receiving unit, an acquisition unit and a translation unit. The receiving unit receives a document as an object to be translated. The acquisition unit obtains a non-object area from the document that is not an object area to be translated. The translation unit does not perform translation on the non-object area, but on parts other than the non-object area.

【技术实现步骤摘要】
信息处理设备和信息处理方法
本专利技术涉及信息处理设备和信息处理方法。
技术介绍
日本未审查专利申请公开No.2005-167522公开了一种用于使得能实现多个印刷材料的同时光学字符识别(OCR)的技术。此技术致力于改进可由于未能识别通过组版而分离的单词或句子之间的语义关系而降低的字符识别效率,并且使得能实现多个印刷材料的同时OCR。在此技术中,句子的区域元素、它们之间的连接及顺序被作为数字水印信息嵌入在句子中。因此,在执行识别过程之前就准确地识别了字符的顺序,并且提高了字符识别效率。另外,用于指定区域的方法是相对于坐标参照区域而相对化的,并且因此在正确地掌握与印刷材料的关系的同时执行多个印刷材料的同时OCR变得可能。一些文档包括图、公司徽标等。当这样的文档将被翻译时,可存在不应该是要翻译的对象的区域,诸如图或公司徽标中的字符。当文档将被翻译时,通常能够指定作为要翻译的对象的区域,但是通常不可能显式地指定不是要翻译的对象的区域。
技术实现思路
因此,本专利技术的目的是提供用于指定不是要翻译的对象的区域的信息处理设备和信息处理方法。根据本专利技术的第一方面,提供了一种信息处理设备,该信息处理设备包括接收单元、获得单元和翻译单元。所述接收单元接收作为要翻译的对象的文档。所述获得单元从所述文档获得非对象区域,该非对象区域是不作为要翻译的对象的区域。所述翻译单元不对所述非对象区域执行翻译,而是对所述非对象区域以外的部分执行翻译。根据本专利技术的第二方面,所述信息处理设备还包括布置单元,该布置单元在维持尚未被翻译的所述文档中的布局的同时,布置从所述翻译单元获得的翻译结果。根据本专利技术的第三方面,所述布置单元将所述翻译结果布置在除所述非对象区域以外的区域中。根据本专利技术的第四方面,所述信息处理设备还包括分析单元,该分析单元对所述文档执行布局分析。所述获得单元呈现由所述分析单元执行的所述布局分析的结果,并且根据操作者选择所述非对象区域的指令来获得所述非对象区域。根据本专利技术的第五方面,所述获得单元提取与已被指定为不是要翻译的对象的图像相似的图像的区域并且呈现所提取的区域作为候选非对象区域。根据本专利技术的第六方面,所述获得单元获得与已被指定为不是要翻译的对象的图像相似的图像的区域作为所述非对象区域。根据本专利技术的第七方面,所述文档包括表示所述非对象区域的信息图像,并且所述获得单元通过使用所述信息图像来获得所述非对象区域。根据本专利技术的第八方面,所述获得单元获得表示所述非对象区域周围的字符区域中的字符之间的连接关系的信息,并且所述翻译单元根据所述连接关系来执行翻译。根据本专利技术的第九方面,所述信息处理设备还包括分析单元,该分析单元对所述文档执行布局分析。所述获得单元呈现由所述分析单元执行的布局分析的结果,并且根据操作者选择所述连接关系的指令来获得表示所述字符区域中的所述字符之间的所述连接关系的所述信息。根据本专利技术的第十方面,提供了一种信息处理方法,该信息处理方法包括以下步骤:接收作为待翻译对象的文档;从所述文档获得非对象区域,该非对象区域是不作为要翻译的对象的区域;以及不对所述非对象区域执行翻译,而是对所述非对象区域以外的部分执行翻译。根据本专利技术的所述第一方面,能够指定不是要翻译的对象的区域。根据本专利技术的所述第二方面,能够在维持尚未被翻译的文档的布局的同时布置翻译结果。根据本专利技术的所述第三方面,能够将翻译结果布置在非对象区域以外的区域中。根据本专利技术的所述第四方面,能够呈现布局分析的结果并且根据操作者的选择指令来获得区域。根据本专利技术的所述第五方面,能够提取与已被指定为不是要翻译的对象的图像相似的图像的区域并且呈现所提取的区域作为候选非对象区域。根据本专利技术的所述第六方面,能够获得与已被指定为不是要翻译的对象的图像相似的图像的区域作为非对象区域。根据本专利技术的所述第七方面,能够通过使用包括在文档中的信息图像来获得区域。根据本专利技术的所述第八方面,能够根据所述区域周围的字符区域中的字符之间的连接关系来执行翻译。根据本专利技术的所述第九方面,能够呈现布局分析的结果并且根据操作者的选择指令来获得表示字符区域中的字符之间的连接关系的信息。根据本专利技术的所述第十方面,能够指定不是要翻译的对象的区域。附图说明将基于下图详细地描述本专利技术的示例性实施方式,其中:图1是例示根据示例性实施方式的示例配置的概念模块配置图;图2A和图2B是例示根据示例性实施方式的示例系统配置的说明图;图3是例示根据示例性实施方式的要处理的对象的示例的说明图;图4是例示根据示例性实施方式的示例过程的流程图;图5是例示根据示例性实施方式的示例过程的说明图;图6是例示非对象区域表的示例数据结构的说明图;图7是例示布局信息表的示例数据结构的说明图;图8是例示布局信息表(排除后)的示例数据结构的说明图;图9A、图9B、图9C和图9D是例示根据示例性实施方式的示例过程的说明图;图10是例示根据示例性实施方式的示例过程的流程图;图11A、图11B、图11C和图11D是例示根据示例性实施方式的示例过程的说明图;图12是例示根据示例性实施方式的示例过程的流程图;图13是例示根据示例性实施方式的示例过程的流程图;图14A和图14B是例示了根据示例性实施方式的示例过程的说明图;图15是例示非对象图像表的示例数据结构的说明图;图16是例示根据示例性实施方式的示例过程的流程图;图17A和图17B是例示根据示例性实施方式的示例过程的说明图;图18A、图18B1、图18B2、图18C和图18D是例示根据示例性实施方式的示例过程的说明图;图19A、图19B1、图19B2和图19C是例示根据示例性实施方式的示例过程的说明图;图20A、图20B和图20C是例示根据示例性实施方式的示例过程的说明图;以及图21是例示实现示例性实施方式的计算机的示例硬件配置的框图。具体实施方式在下文中,将参照附图描述本专利技术的示例性实施方式。图1是例示了根据示例性实施方式的示例配置的概念模块配置图。一般而言,模块是可以在逻辑上彼此分离的软件(计算机程序)或硬件的组件。因此,根据示例性实施方式的模块不仅对应于计算机程序中的模块,而且对应于硬件配置中的模块。因此,示例性实施方式的描述包括用于使得计算机充当那些模块的计算机程序(用于使得计算机执行单独的程序步骤的程序、用于使计算机充当单独的单元的程序或者用于使计算机实现单独的功能的程序)、系统和方法的描述。为了描述的方便起见,将使用表达“存储”和“使...存储”及与其等同的表达。这些表达在计算机程序的情况下具体地意指“使存储器存储”或“执行控制以使存储器存储”。模块可以按照一对一关系与功能相对应。在封装方面,单个模块可以由单个程序构成,多个模块可以由单个程序构成,或者单个模块可以由多个程序构成。另外,多个模块可以由单个计算机来实现,或者单个模块可以由分布式或并行环境中的多个计算机来实现。另选地,单个模块可以包括另一模块。在下文中,“连接”用于指代逻辑连接(数据、指令的传输和接收、数据片之间的参照关系等)以及物理连接。“预先确定”意指在对象处理之前被确定,并且包括在根据示例性实施方式的处理开始之后以及在根据示例性实施方式的处理开始之前根据目前情形/状态或者根据对象处理之前的先前情形/状态被确定的含义。在存在多个本文档来自技高网...

【技术保护点】
1.一种信息处理设备,该信息处理设备包括:接收单元,该接收单元接收作为翻译对象的文档;获得单元,该获得单元从所述文档获得非对象区域,该非对象区域是不作为翻译对象的区域;以及翻译单元,该翻译单元不对所述非对象区域执行翻译,而是对所述非对象区域以外的部分执行翻译。

【技术特征摘要】
2017.05.15 JP 2017-0961891.一种信息处理设备,该信息处理设备包括:接收单元,该接收单元接收作为翻译对象的文档;获得单元,该获得单元从所述文档获得非对象区域,该非对象区域是不作为翻译对象的区域;以及翻译单元,该翻译单元不对所述非对象区域执行翻译,而是对所述非对象区域以外的部分执行翻译。2.根据权利要求1所述的信息处理设备,该信息处理设备还包括:布置单元,该布置单元在维持未被翻译的所述文档中的布局的同时布置从所述翻译单元获得的翻译结果。3.根据权利要求2所述的信息处理设备,其中,所述布置单元将所述翻译结果布置在所述非对象区域以外的区域中。4.根据权利要求1所述的信息处理设备,该信息处理设备还包括:分析单元,该分析单元对所述文档执行布局分析,其中,所述获得单元呈现由所述分析单元执行的所述布局分析的结果,并且根据操作者的选择所述非对象区域的指令来获得所述非对象区域。5.根据权利要求4所述的信息处理设备,其中,所述获得单元提取与已被指定为不是翻译对象的图像相似的图像的...

【专利技术属性】
技术研发人员:伊藤泰
申请(专利权)人:富士施乐株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1