【技术实现步骤摘要】
文字翻译方法及其装置
本专利技术涉及文字翻译方法及其装置,更具体是涉及一种识别输入的图像上的文字,并对识别的文字提供以文章为单位的翻译的方法及其装置。
技术介绍
在识别图像或数字文稿上的文字方面广泛使用光学文字识别(OpticalCharacterRecognition,以下称为‘OCR’)技术。根据OCR技术,比较通过OCR程序读取的文字与预先存储的文字执行文字识别。即,对于OCR技术来讲,用于文字识别的考虑对象仅仅是个别文字的形状,并未考虑识别的文字构成的单词及文章。对于通过这种OCR技术识别的文字,翻译程序机器翻译成其他语言的情况下,翻译程序对OCR程序的文字识别结果单纯地执行翻译,因此具有翻译准确度低的问题。例如,通过OCR技术识别的文字构成的一个文章分成多个行输入的情况下,翻译程序不考虑文章单位,而是以输入的行为单位执行翻译,因此执行的并不是对一个文章的翻译。尽管如此,目前还没有对通过OCR程序识别的文字以文章单位确定翻译单位的方法。并且,没有将用户事件信息反映到OCR程序的文字识别结果以提高对翻译对象的可信度的方法。
技术实现思路
技术问题本专利技术的目的在于提供一种识别输入的图像内容上的文字,对识别出的文字执行以文章为单位的翻译的方法及其装置。具体来讲,本专利技术的目的在于提供一种识别通过OCR程序识别的文字构成的文章,并以识别的文章为基准提供翻译服务的方法。并且,本专利技术的目的在于提供一种提供显示翻译对象及翻译结果的图形用户接口(GraphicUserInterface,以下称为‘GUI’)的方法及其装置。本专利技术的另一目的在于提供一种根据 ...
【技术保护点】
一种文字翻译方法,其由文字翻译装置执行,其特征在于,包括:获取图像内容的步骤;识别所述图像内容上的第一语言的文字及所述第一语言的文章确定符号的步骤;根据识别的所述文章确定符号提取由识别的所述文字构成的第一语言的文章的步骤;利用用户事件信息,根据提取的所述第一语言的文章生成翻译对象文章的步骤;以及将生成的所述翻译对象文章翻译成第二语言,并显示翻译成所述第二语言的文章的步骤。
【技术特征摘要】
1.一种文字翻译方法,其由文字翻译装置执行,其特征在于,包括:获取图像内容的步骤;识别所述图像内容上的第一语言的文字及所述第一语言的文章确定符号的步骤;根据识别的所述文章确定符号提取由识别的所述文字构成的第一语言的文章的步骤;利用用户事件信息,根据提取的所述第一语言的文章生成翻译对象文章的步骤;以及将生成的所述翻译对象文章翻译成第二语言,并显示翻译成所述第二语言的文章的步骤。2.根据权利要求1所述的文字翻译方法,其特征在于:获取所述图像内容的步骤包括:接收用户输入的包括语言选择信息的用户事件信息的步骤,识别所述第一语言的文字及所述第一语言的文章确定符号的步骤包括:根据所述语言选择信息识别所述第一语言的文字的步骤;以及根据预先定义的各语言的文章分割规则识别所述第一语言的文章确定符号的步骤。3.根据权利要求2所述的文字翻译方法,其特征在于:识别所述第一语言的文字的步骤包括:识别所述图像内容上的至少一个文字列的步骤,提取由识别的所述文字构成的第一语言的文章的步骤包括:从识别的所述文字列中识别出第一文字列及第二文字列的文字大小的步骤;以及根据识别的所述文字大小,将所述第一文字列提取成所述第一语言的文章的步骤。4.根据权利要求2所述的文字翻译方法,其特征在于:识别所述第一语言的文字的步骤包括:识别所述图像内容上的至少一个文字列的步骤,提取由识别的所述文字构成的第一语言的文章的步骤包括:从识别的所述文字列上的文字中选择包括位于右侧末端的文字的文字列的步骤;第一判断步骤,以位于所述右侧末端的文字的x轴坐标为基准,判断是否存在选择的所述文字列的上位文字列上的文字;以及所述第一判断步骤的结果为不存在所述上位文字列上的文字的情况下,将选择的所述文字列提取成所述第一语言的文章的步骤。5.根据权利要求4所述的文字翻译方法,其特征在于:所述第一判断步骤的结果为存在所述上位文字列上的文字的情况下,将包括选择的所述文字列及所述上位文字列的多个文字列提取成所述第一语言的文章的步骤。6.根据权利要求4所述的文字翻译方法,其特征在于:将选择的所述文字列提取成所述第一语言的文章的步骤包括:第二判断步骤,以位于选择的所述文字列的左侧末端的文字的x轴坐标为基准,判断是否存在选择的所述文字列的下位文字列上的文字;以及所述第二判断步骤的结果为不存在所述下位文字列上的文字的情况下,将选择的所述文字列提取成所述第一语言的文章的步骤。7.根据权利要求6所述的文字翻译方法,其特征在于:所述第二判断步骤的结果为存在所述下位文字列上的文字的情况下,将包括选择的所述文字列及所述下位文字列的多个文字列提取成所述第一语言的文章的步骤。8.根据权利要求2所述的文字翻译方法,其特征在于,根据所述语言选择信息识别所述第一语言的文字的步骤包括:确定所述图像内容上的第一语言的文字中第一文字的后补文字的步骤;确定所述图像内容上的第一语言的文字中与所述第一文字相邻的第二文字的后补文字的步骤;生成至少一个所述第一文字的后补文字与所述第二文字的后补文字之间的组合的步骤;根据所述语言选择信息,从生成的所述组合中选择被识别为所述第一文字及所述第二文字的概率最高的文字组合的步骤;以及根据选择的所述文字组合识别所述第一语言的文字的步骤。9.根据权利要求8所述的文字翻译方法,其特征在于:生成的所述文字组合包括所述第一文字的后补文字与所述第二文字的后补文字在生成的所述文字组合的位置信息、关于所述第一文字的后补文字被识别为所述第一文字的概率值与所述第二文字的后补文字被识别为所述第二文字的概率值的信息。10.根据权利要求8所述的文字翻译方法,其特征在于,生成所述翻译对象文章的步骤包括:利用所述用户事件信息,根据提取的所述第一语言的文章生成所述翻译对象文章的后补文章的步骤;根据生成的所述后补文章,从生成的所述文字组合中选择包含于文章的概率最高的文字组合的步骤;以及将包括包含于所述文章的概率最高的文字组合的文章确定为翻译对象文章的步骤。11.根据权利要求8所述的文字翻译方法,其特征在于,根据所述语言选择信息,从生成的所述组合中选择被识别为所述第一文字及所述第二文字的概率最高的文字组合的步骤包括:比较生成的所述文字组合与从预先设定的语言模型获取的一个以上的文章或包含于所述文章的单词的步骤;以及根据比较结果,将与获取的所述一个以上的文章或包含于所述文章的单词匹配的概率最高的文字组合选为被识别为所述第一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。