当前位置: 首页 > 专利查询>宋柏君专利>正文

一种基于拍照手机的光学字符识别及翻译方法技术

技术编号:3648011 阅读:203 留言:0更新日期:2012-04-11 18:40
该发明专利技术是一种利用拍照手机的拍照功能、通过光学字符识别达到翻译的方法,是主要通过以下步骤来实现的:获取目标文稿的原始图像信息、光学字符识别、显示识别的结果、对识别结果进行验证、翻译、结果显示、发音,其优点和效果是:可以利用拍照手机的拍照功能,随时随地对文字进行识别并翻译、发音。

【技术实现步骤摘要】

该专利技术是一种基于拍照手机的、可对字符进行识别并翻译的方法,是应用在手机领域。
技术介绍
现在手机已经成为人们必不可少一件通讯工具,其功能也越来越强大,价格也越来越低,有的手机已经可以提供光学字符识别功能了,即对名片上的文字可以进行识别,如LG公司与摩托罗拉公司都有这样的产品,但是它们仅仅只是识别文字,即把光学字符识别并保存为手机与电脑可以存储并处理的文本格式,除此之外没有太多的其它实用功能。而现在人们对文字的翻译是常用的功能之一,特别是在嵌入式设备如PDA、学习机上,出现了各种各样的方案与产品,但这些产品一般都是手工输入字母机器翻译,非常不方便,而光学字符识别输入可以较好地解决这个问题,中国专利CN200410073266.5就是这样一个类似的方案,它的主要步骤为摄取、辨识、翻译与显示,已经涉及到了各个主要的步骤,但是这个方案也存在不足,就是因为手机硬件与识别软件的一些局限性,摄取图像后辨识后的结果往往不正确,如果这样就直接翻译的话就可能会导致错误,因为翻译是两语种之间的转换,如果不加验证出现了错误很不容易发现,所以可靠性会大大降低。
技术实现思路
该专利技术的目的就是提供一种利用拍照手机实现直接可以对名片、文稿等进行拍照,直接得到标准格式的图像信息,然后进行识别与验证,最后再翻译以及发音,以保证识别结果的正确性。该专利技术的目的是通过以下的方法和步骤来实现的(1)获取目标文稿的原始图像信息;(2)对具有对文字、名片、表格等图像信息,启动光学字符识别程序或驱动方法,对文字及表格进行识别;(3)显示识别的结果;(4)对识别结果进行验证,如果识别结果正确则进行下一步,否则重新进行第一步,获取图像并重复上述步骤;(5)对正确的识别结果进行翻译;(6)对翻译的结果进行显示。为了更加便于使用,可以在对翻译的结果进行显示的同时或稍候,调用发音模块进行发音。该专利技术的优点和效果是充分利用现有拍照手机的拍照功能,可以对文稿、表格等进行光学字符识别与验正,可以保存为标准格式的字符文本信息,并且可以直接翻译成为另一种文字,并可调用发声模块发出声音。附图说明下面结合附图对本专利技术作进一步说明。图1是本专利技术提出的的流程与步骤示意图。图2是本专利技术提出的的另一流程与步骤示意图。具体实施例方式由于现在手机的普及化,特别是拍照手机的流行,为图像处理提供了便利条件,在实际生活中,光学字符识别就是可以通过获取图像来实现的,如在手机内载入光学字符识别程序,就可以对所获取的图像进行识别,并且可以进行翻译,甚至发音。过程为如下所示(1)获取目标文稿的原始图像信息,这个获取图像可以由拍照手机直接摄取获得,也可以直接获得现有的图像,如存储、下载、复制、传送到拍照手机上等,目标文稿可以是文稿,也可以是名片,甚至是表格,所获得的图像的质量与拍照手机的像素有点直接的联系,像素越高识别的效果越好。(2)对具有对文稿、名片、表格等图像信息,启动手机内预先载入的光学字符识别程序或驱动方法,对文稿及表格进行识别。(3)在手机的显示屏幕上显示识别后的结果。(4)用户对识别后的结果进行验证,看是否与原始图像所表达的信息一致,如果识别结果正确则进行下一步,否则重新进行第一步,获取图像并重复上述步骤。这样做的原因在于由于受到拍照手机的像素限制、使用条件不理想以及用户使用不当等原因,都非常容易造成光学字符识别结果的不正确,如果只是直接、简单的、同一种文字的识别,没有经过转换与翻译,用户可以容易直接发现,但如果要将原文识别并翻译成为另一种文字,用户就可能会对翻译前的文字不熟悉,那么就无法判断翻译的结果,是否是他自己本来想要的结果,比如,一个不懂中文的美国人到中国来旅游,看到中文标识后看不懂,就通过拍照手机把它拍下来识别,再翻译成为英文来理解,如果在翻译之前,他对图像与识别后的文字时行比较,经过确认正确后再进行翻译,这时的结果是可以保证正确的,如果不经过确认直接就进行翻译,就不能够保证翻译的正确性,这也是本专利技术所要强调的要点。(5)对识别的结果进行翻译,在拍照手机里预先载入了翻译模块,可以直接调用与识别结果相对应的单词与语句,直接使之对应起来。(6)对翻译的结果进行显示,将上述对应的结果在手机的屏幕上显示出来,使用者可以直接阅读。上述的过程就基本完成了由拍照手机实现光学字符识别以及翻译的功能。在上述的基础上,为了更加便于使用,可以在对翻译的结果进行显示的同时或稍候,对翻译的结果进行发音,可以在手机内载入发音模块,当翻译的结果出来以来,通过程序设定或是按钮控制,调用发音模块进行发音,完成发音的功能。所以,上述的方案适用于拍照手机对名片、文稿、文字标识的识别、翻译、保存,不但可以应用于中文,如果配套的识别软件为其它语种,也可以相互识别以及翻译,甚至也都可以发音,为学习工作生活提供极大的便利。虽然这里只说明了本专利技术的一个实施例,但其意并非限制本专利技术的范围、适用性和配置。相反,对实施例的详细说明可使本领域技术人员得以实施。应能理解,在不偏离所附权利要求书确定的本专利技术精神和范围情况下,可对一些细节做适当变更和修改。权利要求1.一种基于拍照手机并可对字符进行识别并翻译的方法,其步骤为(1)获取目标文稿的原始图像信息;(2)对具有对文稿、名片、表格等图像信息,启动光学字符识别程序或驱动方法,对文字及表格进行识别;(3)显示识别的结果;(4)对识别结果进行验证,如果识别结果正确则进行下一步,否则重新进行第一步,获取图像并重复上述步骤;(5)对识别的结果进行翻译;(6)对翻译的结果进行显示。2.根据权利要求1所述的方法,其特征在于在对翻译的结果进行显示的同时或是稍候,调用发音模块进行发音。3.据权利要求1所述的方法,其中所提及的(1)中获取目标文稿的原始图像信息,是指可以直接对准目标图像进行拍摄。4.根据权利要求1所述的方法,其中所提及的(1)中获取目标文稿的原始图像信息,是指可以由其它设备存储、下载、复制、传送或是输入到手机上的图像信息。全文摘要该专利技术是一种利用拍照手机的拍照功能、通过光学字符识别达到翻译的方法,是主要通过以下步骤来实现的获取目标文稿的原始图像信息、光学字符识别、显示识别的结果、对识别结果进行验证、翻译、结果显示、发音,其优点和效果是可以利用拍照手机的拍照功能,随时随地对文字进行识别并翻译、发音。文档编号G06K9/72GK101059839SQ20061007226公开日2007年10月24日 申请日期2006年4月17日 优先权日2006年4月17日专利技术者宋柏君 申请人:宋柏君本文档来自技高网...

【技术保护点】
一种基于拍照手机并可对字符进行识别并翻译的方法,其步骤为:(1)获取目标文稿的原始图像信息;(2)对具有对文稿、名片、表格等图像信息,启动光学字符识别程序或驱动方法,对文字及表格进行识别;(3)显示识别的结果;(4)对识别结果进行验证,如果识别结果正确则进行下一步,否则重新进行第一步,获取图像并重复上述步骤;(5)对识别的结果进行翻译;(6)对翻译的结果进行显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:宋柏君
申请(专利权)人:宋柏君
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利