当前位置: 首页 > 专利查询>王学庆专利>正文

一种图像文本识别翻译眼镜及方法技术

技术编号:11677602 阅读:158 留言:0更新日期:2015-07-06 04:25
本发明专利技术涉及图像文本识别翻译领域,尤其涉及一种图像文本识别翻译眼镜及方法。其中,该方法包括:图像文本识别翻译眼镜的在眼镜框架上安装有ARM11处理器的硬件电路;安装的高精度微型摄像头,高精度微型摄像头与硬件电路相连接;图像文本识别翻译眼镜中安装的透明视像镜片,图像文本识别翻译眼镜中安装的语音输出耳机;带有高精度摄像头的智能手机;各自独立实现在现场实现可视翻译方法,把待识别有文本图像中的文本区域文本信息,输出到图像文本识别翻译眼镜视像镜片或带有高精度摄像头的智能手机屏幕并可以输出翻译语音信息。用户能够获取到对应的翻译文本知识信息和语音信息,而无需进一步通过手工的方式获得知识信息,显然更加方便省力。

【技术实现步骤摘要】

本专利技术涉及图像文本识别翻译领域,尤其涉及。
技术介绍
目前,用户有很高的翻译请求,即使是学术非常高的医生、教授专家,在长时间不接触外文知识和年龄高的情况下,看一些外文资料和文献,或是观光于国内外景区和酒店等众多场合,都会遇到不认识的中文文本或外文文本资料信息及带有文本的图片信息,采用摄像头拍摄带有中文文本或外文文本的资料信息和带有文本图片图像信息,采集到有文本的资料和图片图像的应用越来越广泛,图像文本识别技术将图像中的文本进行识别,转换为文本,减轻了用户输入对应文本信息的负担,通过翻译处理,输出中文文本或外文文本的翻译结果,显示在屏幕上。最接近的图像文本识别翻译技术是借助谷歌眼镜,用语音输入待翻译的文本,由谷歌眼镜输出翻译文本于屏幕或文本语音输出信息;还有日本的NEC翻译眼镜和百度眼镜依靠后台的服务器系统,根据语音输入、摄像、定位、自学习输出最接近的文本语音信息。但是,在需要翻译的现场,上述两种翻译方法存在的冋题是:(1)面对有文本的资料和文本的图片图像,若没有语音文本输入信息时,谷歌眼镜便无法输出翻译后的文本信息;(2)在不能连接到互联网和局域网环境下,日本的NEC翻译眼镜和百度眼镜便不能输出翻译后的文本信息;有文本的资料和带文本的图片图像资料,摄像头提取的文本信息图像,很难在现场看到翻译后的文本信息。
技术实现思路
本专利技术旨在至少解决上述技术问题之一。为此,本专利技术的第一个目的在于提出一种图像文本识别翻译眼镜。该眼镜在两个镜片中央安装了一个高精度微型摄像头,两个镜片是透明视像镜片,在眼镜框架上安装有ARMll处理器的硬件电路,高精度微型摄像头与硬件电路相连接,透明视像镜片与硬件电路相连接,硬件电路具有操作系统和大容量存储器,大容量存储器下载存储有本地知识库和在线网络知识库的译文数据库,通过高精度微型摄像头提取有文本的资料图片或带有文本的图像信息,经具有操作系统硬件电路的功能软件获取待识别图像中的文本区域、利用识别结果查询知识库获得识别结果对应的知识信息、在返回所述识别结果时,推送包含所述知识信息的知识拓展词包,知识拓展词包是英译汉、汉译英、多语言翻译、中文解释等词包,输出翻译结果文本信息到视像镜片,让用户从视像镜片中看到翻译结果的文本信息,还可以语音输出翻译信息。本专利技术的第二个目的在于提出一种翻译方法。为了实现上述目的,本专利技术第一个目的实施的翻译方法,适合于带有高精度摄像头的智能手机,在现场实现可视翻译方法,具体实现是:高精度摄像头提取有文本的资料图片或带有文本的图像信息,智能手机屏幕看到翻译结果文本信息,智能手机具有大容量存储器下载存储有本地知识库和在线网络知识库的译文数据库,智能手机操作系统具有功能软件获取待识别图像中的文本区域、利用识别结果查询知识库获得识别结果对应的知识信息、在返回所述识别结果时,推送包含所述知识信息的知识拓展词包,知识拓展词包是英译汉、汉译英、多语言翻译、中文解释等词包,输出翻译结果文本信息到智能手机屏幕,让用户从智能手机屏幕中看到翻译结果的文本信息,还可以语音输出翻译信息。由以上技术方案可以看出,本专利技术利用文本识别的结果查询知识库获得识别结果对应的翻译文本知识信息,并包含在翻译文本知识拓展词包中连同识别结果一起返回给用户的图像文本识别翻译眼镜视像镜片上或从智能手机屏幕中看到翻译结果的文本信息,使得用户在现场获取图像中文本识别结果的同时,能够获取到对应的翻译文本知识信息和语音信息,而无需进一步通过手工的方式获得知识信息,显然更加方便和省力。【附图说明】图1为本专利技术实施例提供的图像文本识别翻译眼镜示意图。图2为本专利技术实施例提供的图像文本识别翻译的方法流程图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。如图1所示,本专利技术实施例提供的图像文本识别翻译眼镜示意图。Tl为图像文本识别翻译眼镜的在眼镜框架上安装有ARMll处理器的硬件电路;T2为在图像文本识别翻译眼镜中安装的高精度微型摄像头,高精度微型摄像头与硬件电路相连接;Τ3为在图像文本识别翻译眼镜中安装的透明视像镜片,Τ4和Τ5为在图像文本识别翻译眼镜中安装的语音输出耳机。为了顺利实现图1所示的图像文本识别翻译眼镜和使用带有高精度摄像头的智能手机实现现场可视翻译方法,采用了图2所示的图像文本识别翻译的方法流程图。包括如下步骤: 步骤SI,翻译眼镜存储器下载存储有本地知识库和在线的网络知识库译文数据库,优选地,在本专利技术的一个实施例中,下载存储有本地知识数据库和在线的网络数据库可包括海量的生物、物理、化学、计算机、医疗、文史、经济、政治、新闻、综合等方面的英译汉、汉译英、多语言翻译、中文解释等词包信息数据库。步骤S2,翻译眼镜摄像头根据人体视线获取待识别有文本图像中的文本区域获取文本图像。成熟的技术是获取待识别文本图像的灰度图,其中图像中用灰度表示的图像称作灰度图。步骤S3,使用多种图像预处理方法来处理文本图像,以获得多组二值图像,包括:二值化计算纵横比,畸变校正,校正补偿。在一般的文本图像识别系统中,对图像仅进行一次二值化处理。即使该二值化处理中所使用的阈值对文本图像中的文本整体识别率是最优的,使用不同的图像预处理方法来处理文本图像,获得不同的两组或两组以上的二值图像,以保证待识别的文本图像中的每个字符都能有较佳的识别结果。具体地,文本图像通过二值化处理将彩色图像转化为黑白图像。二值化包括两部分,A、图形转为黑白,一般通过使用一个判别函数,接收一个色值,返回真/假的布尔结果.分别表示黑(字符)和白(背景).因为不同验证码这部分不同,一般使用配置的方法.常见的如以下几种中根据情况具体选一种:1、直接取黑色为黑,非黑色(包括灰色)为白.(这种在部分图片中可能让字体变细并出现断掉的问题);2、直接取白色为白,非白色(包括灰)为黑,(这种在一些情况下会让原本不相连的两个字符连在一起了);3、亮度超过某个临界值的颜色为白,其他为黑(这种相当于上面两种的折中,关键在于这个临界值到底取多少,取决于具体验证码);4、前述第3种会产生的问题是如果背景和字符亮度一样就会失效(比如相同亮度的蓝色背景和红色字符).所以不用亮度而是取一个色彩通道(比如红/绿/兰其中一个)的值,跟一个临界值比较.至于取哪个值只要按照图片的颜色来定一个区分度高的即可;5、混合使用亮度,灰度,色度等值,通过加权运算后与临界值比较,效果好,通用性高但运算量较大,以上1-4都不能实现时用这种方法。B、去除噪点.其实转黑白的过程已经有一定的去除噪点的作用(这就是为什么把转黑白放在第一步而去噪点放第二步)剩下的噪点可通过对每个黑点判断周围8个位置(上,下,左,右,左上,右上,左下,右下)的黑点数,如果小于某个值(比如3,(1-7)这个数越小,去除的点越少,越大则被去除的点越多,需要根据具体噪点情况设置,一般为2-4合适)则这个点为噪点。C、例外情况,有些情况下噪点会造成步骤A无法进行或者难度变大,(比如噪点颜色和字符,背景都不同,并且干扰了A使用的函数的返回值)这个时候可以先进行B再进行A。对二值化处理过的图片畸变校正和校正补偿方法,对二值化处理过的图片验证垂直的方向做垂直投影,并计算垂直投影的每个本文档来自技高网...

【技术保护点】
一种图像文本识别翻译眼镜及方法,其特征在于,包括:一种图像文本识别翻译眼镜T1 为图像文本识别翻译眼镜的在眼镜框架上安装有ARM11处理器的硬件电路;T2 为在图像文本识别翻译眼镜中安装的高精度微型摄像头,高精度微型摄像头与硬件电路相连接;T3为在图像文本识别翻译眼镜中安装的透明视像镜片, T4和T5为在图像文本识别翻译眼镜中安装的语音输出耳机;带有高精度摄像头的智能手机;各自独立实现在现场实现可视翻译方法,把待识别有文本图像中的文本区域文本信息,输出到图像文本识别翻译眼镜视像镜片或带有高精度摄像头的智能手机屏幕并可以输出翻译语音信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:王学庆乔晋兴乔豪男
申请(专利权)人:王学庆
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1