对基于照相机的图像中的字符进行识别和翻译的方法技术

技术编号:4206836 阅读:309 留言:0更新日期:2012-04-11 18:40
提供了一种用于识别由照相机拍摄的图像及与电子词典相关联地翻译字符的方法。该方法包括从拍摄的字符图像中直接选择要识别的区域并执行字符识别、与词典数据相关联地翻译和识别用户选择的单词的字符,以及在屏幕设备上显示与词典数据相关联的对用户选择的字符或单词的翻译结果信息。该识别包括:向用户提供所选的字符图像区域的位置信息和所识别字符串单词的位置信息,然后翻译用户所选的位置区域中的字符串或单词。与电子词典相关联的搜索和翻译是用于与电子词典数据库相关联地搜索所选的字符或单词,并向用户提供翻译结果。

【技术实现步骤摘要】

本专利技术涉及字符识别,更特别地,涉及对照相机拍摄的图像中所包含的字符进行识别及与词典相关联地对所识别字符进行翻译的方法。
技术介绍
传统的字符识别通常涉及由扫描仪对纸质文档的内容进行扫描、然后将所扫描的内容的格式转化为文本文件或电子文档的格式的方法。然而,最近提出了一种识别由便携式数码设备拍摄的图像中的字符的方法,其中该便携式数码设备上安装有小型数码相机。传统扫描仪仅限于识别写于纸上的字符。另一方面,其上安装了数码相机的便携式数码设备能够使用相机进行光学字符识别(OCR)。也就是,使用安装在便携式数码设备上的相机进行的字符识别方法能够识别出现于各种介质(例如,纪念碑、道路指示牌、菜单和各种说明性笔记)上的字符。然而,如上所述,在使用字符识别的相机的过程中,不存在对要识别的字符的限制。因此,会发生这样的情况:不仅由于要识别的字符的多样性而且由于外部因素(例如,要识别字符周围的光线)而无法识别字符。图1是示出根据现有技术的用于识别所拍摄的图像中的字符的字符识别方法的流程图。参见图1,传统字符识别方法100包括:在步骤S1,用照相机拍摄包括字符的图像;在步骤S2,处理所拍摄图像的数据;接口步骤S3;在步骤S4,将每个字符标准化;在步骤S5,提取每个经标准化的字符的特征;在步骤S6,基于每个字符的所提取的特征来识别字符和单词;以及在步骤S7,提供翻译结果。更具体地,步骤S1包括要识别的字符,以及获取表示主题的图像。步骤S2对应于将所拍摄的图像转换为灰度级图像。所拍摄的图像可以是包含各种色彩的彩色图像。然而,对于字符识别来说,必须将不必要的色彩从所拍摄的图像中移除以及将所拍摄的图像转换为灰度级图像。步骤S3对应于根据用于拍摄图像的照相机的特征及拍摄图像的环境对所拍摄的图像进行补偿,以便获得适于字符识别的格式。还有,步骤S4对应于将每个包含于拍摄的图像中的要识别的字符(例如,最起码的,韩文中的辅音和元音以及英文字母表中的每个字符)转换为具有预定标准的格式的字符。步骤S5对应于提取每个要识别的字符的特征。步骤S6对应于基于每个提取字符的特征识别目标字符(即,定义拍摄的字符)。步骤S7对应于将所识别的字符组合成单词并向用户提供组合结果。所述传统方法进一步包括用户接口步骤,在所述用户接口步骤中,来自步骤S6的所识别字符的存储结果数据存储于设备之中,所识别字符或单词被输出到屏幕设备上,接着与电子数据库(DB)相关联地搜索通过用户的选择装置所选的单词,并在屏幕上再次输出这些单词。在上述的传统字符识别方法中,特别地,关于字符图像的识别和词典翻译,能够识-->别包含于字符图像中的字符和实际识别的字符的用户接口是不方便的。在识别整个字符图像期间,由于受限的硬件性能和各种噪声的混入,识别率一般较低,在此,用户接口也是不方便的。
技术实现思路
因此,提出本专利技术以解决现有技术中的上述问题,本专利技术提供了一种用于在能够识别照相机拍摄的图像中的字符的设备中识别字符的方法,其提高了字符识别的准确性,并能识别各种字符,并且同时,改善用户接口的便利性。根据本专利技术的一方面,提供一种用于对照相机拍摄的图像中的字符进行识别和翻译的方法。该方法包括:识别包含于所拍摄图像中的字符和单词,基于词典中的数据对用户所选的单词或字符进行翻译,所述词典与所选的单词相关联;向用户提供所识别的字符和单词,并指示对所选字符或单词的翻译,其对应于用户接口过程,其中识别字符和单词包括翻译在用户接口过程中所选的字符或单词,并通过用户接口处理向用户提供所翻译的字符或单词。附图说明参照下列附图的详细说明,本专利技术的上述及其他示例性特征、方面和优点将更加明显,其中:图1是图解根据现有技术的识别字符的方法的流程图;图2是图解根据本专利技术第一实施例的识别字符的方法的流程图;图3是图解图2中示出的字符识别步骤的流程图;图4是图解图3中示出的预处理步骤的流程图;图5是图解图3中示出的后处理步骤的流程图;图6A和6B、7A到7D和9A到9C是图解根据本专利技术的用于识别字符的方法的例证性示例的说明性视图;图8是图解根据本专利技术第二实施例的识别和翻译字符的方法的流程图;图9A到9C是图解在识别字符图像之后存储的整个识别数据的存储方法的特定示例的框图;图10A到10B及11A到11B是图解根据图3中示出的字符识别步骤处理的字符图像的示例的视图;图12A到12C是图解根据本专利技术第二实施例处理的字符图像的示例的视图;图13A到13D是图解根据向用户提供所选单词的位置信息的方法的字符图像的视图;图14是图解验证方法的流程图,该验证方法用于确定用户所选的搜索单词与搜索的电子词典关键词或词目是否相符;图15A到15D是特定地图解用户所选的搜索单词的电子词典数据库搜索结果的屏幕显示示例的视图;图16是图解根据本专利技术的第三实施例的用于识别和翻译字符图像的方法的流程图;-->图17是图解用于选择电子词典数据库DB搜索单词的一个方法的示例的流程图;图18是图解用于选择电子词典数据库DB搜索单词的另一方法的示例的流程图;图19A到19B和20A到20G是图解用于选择搜索单词的一个方法的示例的视图;图21A到21D是图解当提供电子词典数据库搜索结果时的在字符图整体识别和部分识别之间的差异的视图;图22(a)和图22(b)是图解置于便携式终端中的显示屏上的图像的视图,所述图像对应于操作电子词典的方法;和图23是图解用于连接图22中示出的置于便携式终端中的电子词典的方法的流程图。具体实施方式下面,将参考附图详细描述本专利技术的示例性实施例。在下面的说明中,省略与本专利技术相关的公知的功能或根据本专利技术的配置的详细描述以避免本专利技术的主题不清。本专利技术提供了用于识别包含于拍摄图像中的字符的方法。根据本专利技术的用于识别包含于由照相机拍摄的图像中的字符的方法包括字符和单词的识别及翻译步骤和用户接口步骤。在这里,所述字符和单词的识别及翻译步骤包括:识别包含于拍摄图像中的字符和单词,基于词典中的数据对用户所选的单词进行翻译,该词典与所选单词相关联。所述用户接口步骤向用户提供在所述字符和单词的识别及翻译步骤中所识别出的字符和单词,并指示对由用户所选的字符或单词的翻译。所述字符和单词的识别及翻译步骤包括:翻译在所述用户接口步骤中选择的字符或单词,并通过所述用户接口步骤向用户提供经翻译的字符或单词。在描述根据本专利技术的用于识别字符的方法中,该方法可分为两种方法,一种指定整个拍摄图像作为字符识别的对象,另一种仅指定拍摄图像的部分范围作为字符识别的对象。如上所述的用户接口步骤包括多个步骤,其需要在字符和单词识别及翻译步骤期间提供给用户或用户的选择。图2是图解根据本专利技术第一实施例的用于识别字符的方法的流程图。图2进一步图解了本专利技术的下述实施例:在所述实施例中,指定整个所拍摄图像作为字符识别的对象。参照图2,根据本专利技术的识别由照相机拍摄的图像中的字符的方法包括:字符和单词的识别步骤和用户接口步骤。在这里,所述字符和单词的识别步骤包括:识别包含于所拍摄图像中的字符和单词,并将所识别单词中的每一个与词典中的数据相比较,该词典与所识别单词中的每一个相关联。所述用户接口步骤包括:向用户提供在字符和单词识别步骤中识别出的字符和单词,并根据用户的选择指示字符和单词识别步骤。所本文档来自技高网
...

【技术保护点】
一种方法,用于识别包含于照相机拍摄的字符图像中的字符串或单词,并通过使用内置的电子词典数据库(DB)将所识别的特定字符串或单词翻译成另一种语言,该方法包括:识别拍摄的字符图像中的字符串或单词,其中识别用户选择的字符图像区域中包含的字符串或单词,并对所识别的字符串进行后处理;及执行与电子词典相关联的搜索和翻译,其中与电子词典DB相关联地搜索用户从已被识别和后处理的字符串中包含的单词中选择的字符或单词,并在屏幕设备上显示所搜索到的单词的翻译结果信息;其中识别字符串或单词包括:用户接口连接,其中向用户提供关于所选字符图像区域的位置和所识别的字符串单词的位置的信息,接着,翻译用户所选的位置区域中的字符串或单词,及其中执行与电子词典相关联的搜索和翻译是用于与电子词典DB相关联地搜索在用户接口连接步骤中选择的字符或单词,并通过用户接口连接将翻译结果提供给用户。

【技术特征摘要】
KR 2008-7-10 67098/08;KR 2009-6-25 57266/091.一种方法,用于识别包含于照相机拍摄的字符图像中的字符串或单词,并通过使用内置的电子词典数据库(DB)将所识别的特定字符串或单词翻译成另一种语言,该方法包括:识别拍摄的字符图像中的字符串或单词,其中识别用户选择的字符图像区域中包含的字符串或单词,并对所识别的字符串进行后处理;及执行与电子词典相关联的搜索和翻译,其中与电子词典DB相关联地搜索用户从已被识别和后处理的字符串中包含的单词中选择的字符或单词,并在屏幕设备上显示所搜索到的单词的翻译结果信息;其中识别字符串或单词包括:用户接口连接,其中向用户提供关于所选字符图像区域的位置和所识别的字符串单词的位置的信息,接着,翻译用户所选的位置区域中的字符串或单词,及其中执行与电子词典相关联的搜索和翻译是用于与电子词典DB相关联地搜索在用户接口连接步骤中选择的字符或单词,并通过用户接口连接将翻译结果提供给用户。2.如权利要求1中的方法,其中用户接口连接包括:(a)在屏幕设备上显示照相机拍摄的字符图像之后,在选择用于字符图像识别的识别对象区域范围的过程中,在所述屏幕设备上显示的字符图像上,直接显示正被选择或已被选择的识别区域的位置,以便允许用户直观地验证选择步骤和结果;(b)在所述字符图像上直接显示所识别单词的相关位置信息,以便从所识别的字符图像区域的对应字符识别结果中,确定是否识别了用户要翻译的单词;及(c)在所述屏幕设备上显示的所述字符图像上,直接显示用户从所识别字符图像区域中包含的多个所识别单词中选择的位置处的单词,及从所述电子词典DB搜索的对应的翻译信息,其中,所述用户接口连接提供了所述字符图像与所述电子词典DB的连接功能。3.如权利要求2中的方法,其中,所述用户接口连接进一步包括:(d)确定是否选择不同于用户第一次选择的字符或单词的另一个字符或单词,然后如果用户选择了另一个字符或单词,则返回步骤(c);及(e)如果用户没有选择所识别的字符或单词,则从用户接收确定是否返回步骤(a)的输入。4.如权利要求2中的方法,其中在步骤(a)中,当用户选择整个拍摄图像作为字符识别区域时,执行字符或单词的识别和翻译。5.如权利要求2中的方法,其中对所识别的字符串进行后处理包括:从所识别的字符串中筛选出特定的字符或数字;从所识别的单个字符构建单词,并搜索所构建单词的相关联的词典数据以验证词典含义;及通过步骤(c)向用户提供所识别的字符或单词。6.一种方法,用于识别和翻译通过照相机拍摄包括字符的主题而获得的字符图像中包含的字符串或单词,并通过屏幕设备将结果提供给用户,该方法包括以下步骤:(a)提供用户接口连接,其中用户在拍摄的字符图像中直接选择要识别的区域,并能实时确认所选区域的信息;(b)识别字符并存储用户选择的区域中包含的所识别的字符;(c)通过筛选出特定字符或数字,对步骤(b)中所识别出的字符或字符串中的、存在于包括位于屏幕设备上显示的字符图像中的用户所选择区域处的字符或单词的位置上的字符串进行后处理,然后通过使用电子词典数据库(DB)中的单词将字符串分成可选择的单词,并临时存储结果信息;(d)从步骤(c)中临时存储的单词中,与电子词典DB关联地搜索位于用户第一次选择的区域中的...

【专利技术属性】
技术研发人员:金尚镐黄星泽吴尚昱金玄水金桢林金智勋李东昌吴润济郑熙远
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利