文字翻译方法及其装置制造方法及图纸

技术编号:18018841 阅读:24 留言:0更新日期:2018-05-23 05:08
本发明专利技术提供一种文字翻译方法及其装置。根据本发明专利技术的一个实施例,由文字翻译装置执行的文字翻译方法可包括获取图像内容的步骤;识别所述图像内容上的第一语言的文字及所述第一语言的文章确定符号的步骤;根据识别的所述文章确定符号提取由识别的所述文字构成的第一语言的文章的步骤;利用用户事件信息,根据提取的所述第一语言的文章生成翻译对象文章的步骤;以及将生成的所述翻译对象文章翻译成第二语言,并显示翻译成所述第二语言的文章的步骤。本发明专利技术的文字翻译方法及其装置能够为用户提供更为准确的翻译结果。

【技术实现步骤摘要】
文字翻译方法及其装置
本专利技术涉及文字翻译方法及其装置,更具体是涉及一种识别输入的图像上的文字,并对识别的文字提供以文章为单位的翻译的方法及其装置。
技术介绍
在识别图像或数字文稿上的文字方面广泛使用光学文字识别(OpticalCharacterRecognition,以下称为‘OCR’)技术。根据OCR技术,比较通过OCR程序读取的文字与预先存储的文字执行文字识别。即,对于OCR技术来讲,用于文字识别的考虑对象仅仅是个别文字的形状,并未考虑识别的文字构成的单词及文章。对于通过这种OCR技术识别的文字,翻译程序机器翻译成其他语言的情况下,翻译程序对OCR程序的文字识别结果单纯地执行翻译,因此具有翻译准确度低的问题。例如,通过OCR技术识别的文字构成的一个文章分成多个行输入的情况下,翻译程序不考虑文章单位,而是以输入的行为单位执行翻译,因此执行的并不是对一个文章的翻译。尽管如此,目前还没有对通过OCR程序识别的文字以文章单位确定翻译单位的方法。并且,没有将用户事件信息反映到OCR程序的文字识别结果以提高对翻译对象的可信度的方法。
技术实现思路
技术问题本专利技术的目的在于提供一种识别输入的图像内容上的文字,对识别出的文字执行以文章为单位的翻译的方法及其装置。具体来讲,本专利技术的目的在于提供一种识别通过OCR程序识别的文字构成的文章,并以识别的文章为基准提供翻译服务的方法。并且,本专利技术的目的在于提供一种提供显示翻译对象及翻译结果的图形用户接口(GraphicUserInterface,以下称为‘GUI’)的方法及其装置。本专利技术的另一目的在于提供一种根据输入的图像内容的种类确定适配型翻译单位的方法及其装置。本专利技术的又一目的在于提供一种根据用户事件信息补正翻译对象或翻译结果的方法及其装置。本专利技术目的不限于以上提及的目的,本专利技术所属
的普通技术人员可根据以下记载明确理解未记载的其他目的。技术方案根据用于达成上述目的的文字翻译装置执行的文字翻译方法的一个实施例,可包括获取图像内容的步骤;识别所述图像内容上的第一语言的文字及所述第一语言的文章确定符号的步骤;根据识别的所述文章确定符号提取由识别的所述文字构成的第一语言的文章的步骤;利用用户事件信息,根据提取的所述第一语言的文章生成翻译对象文章的步骤;以及将生成的所述翻译对象文章翻译成第二语言,并显示翻译成所述第二语言的文章的步骤。并且,根据用于达成上述目的的文字翻译装置的一个实施例,文字翻译装置可包括:摄像头,其获取图像内容;输入部,其用于输入用户事件信息;显示部,其显示获取的所述图像内容的全部或一部分;以及控制部,其识别所述图像内容上的第一语言的文字及所述第一语言的文章确定符号,根据识别的所述文章确定符号提取由识别的所述文字构成的第一语言的文章,利用所述用户事件信息,根据提取的所述第一语言的文章生成翻译对象文章,随着生成的所述翻译对象文章翻译成第二语言而控制使得显示翻译成所述第二语言的文章。根据用于达成上述目的的存储于存储介质的一个实施例,计算机程序可以通过与计算机装置结合以运行以下步骤:识别图像内容上的第一语言的文字及所述第一语言的文章确定符号的步骤;根据识别的所述文章确定符号提取识别的所述文字构成的第一语言的文章的步骤;利用用户事件信息,根据提取的所述第一语言的文章生成翻译对象文章的步骤;以及将生成的所述翻译对象文章翻译成第二语言,显示翻译成所述第二语言的文章的步骤。技术效果根据本专利技术的一个实施例,对OCR处理的文字执行以文章为单位的翻译,因此能够为用户提供更为准确的翻译结果。根据本专利技术的一个实施例,根据输入内容的种类确定适配型翻译单位,并以确定的翻译单位执行翻译,因此能够为用户提供更为准确的翻译结果。根据本专利技术的一个实施例,根据用户事件信息补正翻译对象或翻译结果,因此能够为用户提供更为准确的翻译结果。并且,根据本专利技术的一个实施例,通过GUI显示翻译对象文章,因此能够为用户提供对翻译准确性的预测可能性,能够为用户提供关于翻译对象的修正功能。附图说明图1为根据本专利技术一个实施例的文字翻译程序的示意图;图2为根据本专利技术另一实施例的文字翻译装置的框图;图3a为根据本专利技术又一实施例的文字翻译方法的流程图;图3b为根据本专利技术又一实施例的上下文识别方法的流程图;图4为本专利技术几个实施例所参见的图像内容的示意图;图5为本专利技术的几个实施例所参见的翻译对象文章的示意图;图6及图7a为用于说明本专利技术的几个实施例所参见的文章提取方式的示意图;图7b为用于说明图7a示出的文章提取过程中利用的数据标准的示意图;图8为本专利技术的几个实施例所参见的GUI的示意图;图9为用于说明根据本专利技术又一实施例的翻译对象文章的修正方法的示意图;图10为本专利技术的几个实施例所参见的文字翻译装置的输出UI的示意图;图11为本专利技术的几个实施例所参见的文字翻译装置的音译输出UI的示意图;图12为本专利技术的几个实施例所参见的基于布局识别的翻译对象文章确定方式的示意图。具体实施方式以下参见附图具体说明根据本专利技术的优选实施例。参见附图及以下说明的实施例便可明确本专利技术的优点、特征及实现方法。但是,本专利技术并非限定于以下公开的实施例,而是以不同的多种形态实现,本实施例只是使本专利技术的公开更加完整,使本专利技术所属
的普通技术人员容易理解专利技术的范畴,本专利技术由技术方案的范畴定义。在整篇说明书中,同一附图标记表示同一构成要素。若无其他定义,则本说明书中使用的所有术语(包括技术及科学术语)可按照本专利技术所属
的普通技术人员普遍理解的意思来使用。并且,关于通常使用的词典定义的术语,在没有明确的特殊定义的前提下不得理想解释或过度解释。本说明书中使用的术语用于说明实施例,而并非在于限定本专利技术。本说明书中单数型在语句中没有特殊记载的情况下还包括复数型。本说明书中,文章确定符号是指排列有文字列或连接的多个文字的情况下,用于从其他文字区分出连续文字组,能够确定区分出的文字组为文章的符号。例如,罗列的多个文字中间出现标点符号“.”、“?”、“!”、“:”“/”等的情况下,以所述符号为分界区分前面的文字组与后面的文字组。并且,如上区分出的文字组构成文章。此处,本说明书将区分所述文字组的符号称为文章确定符号。另外,本说明书的文章确定符号不限于以上举例介绍的文章确定符号。例如,′(单引号)或″(双引号)成对排列的情况下,单引号对或双引号对内部的文字组区分于外部的文字组,因此相当于本说明书的文章确定符号。另外,多个文字组上的文章并不仅限于通过文章确定符号区分。例如,多个文字组以预定的空间,例如以空格、跳格(tab)、行等为分界区分的情况下,或将文字组所在布局从空间上进行区分的情况下,位于所述分界的前后或不同布局上的文字组可以是不同的文章。并且,所述预定的空间按预定图案重复出现于多个文字组内的情况下,所述空间可能是用于区分文章内的单词的空间而并非用于确定文章。因此,应理解本说明书中所指的文章是通过文章确定符号区分的一个文字组单位。或者,应理解多个文字组内通过预定的空间区分的一个文字组单位也是根据本专利技术一个实施例的文章。即,在本说明书中文章并非必须包括主语与动词,具有特定意思的题目、标语等情况下也可以理解为本说明书的文章。因此,文章内的段落、包括具有特定本文档来自技高网
...
文字翻译方法及其装置

【技术保护点】
一种文字翻译方法,其由文字翻译装置执行,其特征在于,包括:获取图像内容的步骤;识别所述图像内容上的第一语言的文字及所述第一语言的文章确定符号的步骤;根据识别的所述文章确定符号提取由识别的所述文字构成的第一语言的文章的步骤;利用用户事件信息,根据提取的所述第一语言的文章生成翻译对象文章的步骤;以及将生成的所述翻译对象文章翻译成第二语言,并显示翻译成所述第二语言的文章的步骤。

【技术特征摘要】
1.一种文字翻译方法,其由文字翻译装置执行,其特征在于,包括:获取图像内容的步骤;识别所述图像内容上的第一语言的文字及所述第一语言的文章确定符号的步骤;根据识别的所述文章确定符号提取由识别的所述文字构成的第一语言的文章的步骤;利用用户事件信息,根据提取的所述第一语言的文章生成翻译对象文章的步骤;以及将生成的所述翻译对象文章翻译成第二语言,并显示翻译成所述第二语言的文章的步骤。2.根据权利要求1所述的文字翻译方法,其特征在于:获取所述图像内容的步骤包括:接收用户输入的包括语言选择信息的用户事件信息的步骤,识别所述第一语言的文字及所述第一语言的文章确定符号的步骤包括:根据所述语言选择信息识别所述第一语言的文字的步骤;以及根据预先定义的各语言的文章分割规则识别所述第一语言的文章确定符号的步骤。3.根据权利要求2所述的文字翻译方法,其特征在于:识别所述第一语言的文字的步骤包括:识别所述图像内容上的至少一个文字列的步骤,提取由识别的所述文字构成的第一语言的文章的步骤包括:从识别的所述文字列中识别出第一文字列及第二文字列的文字大小的步骤;以及根据识别的所述文字大小,将所述第一文字列提取成所述第一语言的文章的步骤。4.根据权利要求2所述的文字翻译方法,其特征在于:识别所述第一语言的文字的步骤包括:识别所述图像内容上的至少一个文字列的步骤,提取由识别的所述文字构成的第一语言的文章的步骤包括:从识别的所述文字列上的文字中选择包括位于右侧末端的文字的文字列的步骤;第一判断步骤,以位于所述右侧末端的文字的x轴坐标为基准,判断是否存在选择的所述文字列的上位文字列上的文字;以及所述第一判断步骤的结果为不存在所述上位文字列上的文字的情况下,将选择的所述文字列提取成所述第一语言的文章的步骤。5.根据权利要求4所述的文字翻译方法,其特征在于:所述第一判断步骤的结果为存在所述上位文字列上的文字的情况下,将包括选择的所述文字列及所述上位文字列的多个文字列提取成所述第一语言的文章的步骤。6.根据权利要求4所述的文字翻译方法,其特征在于:将选择的所述文字列提取成所述第一语言的文章的步骤包括:第二判断步骤,以位于选择的所述文字列的左侧末端的文字的x轴坐标为基准,判断是否存在选择的所述文字列的下位文字列上的文字;以及所述第二判断步骤的结果为不存在所述下位文字列上的文字的情况下,将选择的所述文字列提取成所述第一语言的文章的步骤。7.根据权利要求6所述的文字翻译方法,其特征在于:所述第二判断步骤的结果为存在所述下位文字列上的文字的情况下,将包括选择的所述文字列及所述下位文字列的多个文字列提取成所述第一语言的文章的步骤。8.根据权利要求2所述的文字翻译方法,其特征在于,根据所述语言选择信息识别所述第一语言的文字的步骤包括:确定所述图像内容上的第一语言的文字中第一文字的后补文字的步骤;确定所述图像内容上的第一语言的文字中与所述第一文字相邻的第二文字的后补文字的步骤;生成至少一个所述第一文字的后补文字与所述第二文字的后补文字之间的组合的步骤;根据所述语言选择信息,从生成的所述组合中选择被识别为所述第一文字及所述第二文字的概率最高的文字组合的步骤;以及根据选择的所述文字组合识别所述第一语言的文字的步骤。9.根据权利要求8所述的文字翻译方法,其特征在于:生成的所述文字组合包括所述第一文字的后补文字与所述第二文字的后补文字在生成的所述文字组合的位置信息、关于所述第一文字的后补文字被识别为所述第一文字的概率值与所述第二文字的后补文字被识别为所述第二文字的概率值的信息。10.根据权利要求8所述的文字翻译方法,其特征在于,生成所述翻译对象文章的步骤包括:利用所述用户事件信息,根据提取的所述第一语言的文章生成所述翻译对象文章的后补文章的步骤;根据生成的所述后补文章,从生成的所述文字组合中选择包含于文章的概率最高的文字组合的步骤;以及将包括包含于所述文章的概率最高的文字组合的文章确定为翻译对象文章的步骤。11.根据权利要求8所述的文字翻译方法,其特征在于,根据所述语言选择信息,从生成的所述组合中选择被识别为所述第一文字及所述第二文字的概率最高的文字组合的步骤包括:比较生成的所述文字组合与从预先设定的语言模型获取的一个以上的文章或包含于所述文章的单词的步骤;以及根据比较结果,将与获取的所述一个以上的文章或包含于所述文章的单词匹配的概率最高的文字组合选为被识别为所述第一...

【专利技术属性】
技术研发人员:池昌真赵畅洙
申请(专利权)人:希思特兰国际
类型:发明
国别省市:韩国,KR

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1