实现数码相机文字提取和自动翻译功能的方法技术

技术编号:3834353 阅读:437 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种实现数码相机文字提取和自动翻译功能的方法,该方法是通过对文字的拍摄,生成图片,并通过图像处理技术从中提取出文字,并生成文本文件;再用翻译算法把这段文字翻译成中文并显示在LCD上。具体实施步骤如下:步骤一:在菜单中按相应项,把相机设置成翻译模式;步骤二:对文字进行拍照;步骤三:相机自动用文字提取算法进行文字提取,并生成文本文件;步骤四:相机自动利用现有的翻译算法对文字进行翻译;步骤五:将翻译完的结果显示在LCD上。本发明专利技术可以直接利用现有的数码相机硬件资源,无需附加任何硬件成本,使其具有文字提取和自动翻译的功能,能够给用户带来极大的便利。

【技术实现步骤摘要】

本专利技术涉及实现数码相机功能的方法,特别涉及一种实现数码相机文字 提取和自动翻译功能的方法。
技术介绍
目前,随着科技的不断发展,数码相机的功能虽然在不断增加,但市面 上尚无带文字提取和自动翻译附加功能的数码相机。例如,当看到一本外文书籍时,或在外出旅游时看到外文信息。对于不 懂外语的人就不会知道其中的意思,如果用词典查则太费时间。若采用具有 文字提取和自动翻译功能数码相机,就可以对外文信息文字进行拍照,并才艮 据特定的算法在拍得图片中提取出文字,然后利用翻译算法把这段文字翻译 成中文。因此,提供一种,是该领 域科研技术人员需要研究解决的课题之一。
技术实现思路
本专利技术的目的在于克服上述不足之处,提供一种开发数码相机新功能的 方法,即。为实现上述目的本专利技术所采用的实施方式如下 一种实现数码相机文字 提取和自动翻译功能的方法,其特征在于实施步骤如下 步骤一在菜单中按相应项,把相机设置成翻译模式; 步骤二对文字进^f于拍照;步骤三相机自动用文字提取算法进行文字提取,并生成文本文件; 所述文字提取算法如下首先,对文字进行拍摄,通常图片中包括文字和背景两色; (1)要把彩色图像进行灰度化处理;根据心理学研究得出的人类色彩感 光特性,并考虑计算的速度,采用以下公式,按从左到右,从上到下的顺序对每个像素点进行灰度化处理r = (229 x及+ 587 xG + 114 xB + 500) /1000;其中,R、 G、 B分别是这个像素点的R、 G、 B值;这样就把彩色图像转 化为灰度图像;(2) 对得到的灰度图像进行二值化处理;首先确定一个阈值,灰度值大 于这个阈值的点灰度值全部置为255,灰度值小于这个阈值的点灰度值全部置 为0;这个阈值a通过如下爿厶式得到a=所有像素点灰度之和/像素点个数;然后按从左到右,从上到下的顺序对图像的每个像素点进行扫描,当该 点灰度值Y》a时,Y=255;当Y〈a时,Y-0;(3) 比较Y值为0和Y值为255的像素点的个数,个数多的为背景点集合, 个数少的为文字点集合;如果背景点灰度为255,则置背景点灰度为0,文字 点灰度为255;保证文字点灰度始终为255;'(4)对得到的二值化图片进行文字提取;提取的方法是采用如下算法(4.1) 设一标志变量i,并置为0,对图片进行逐行扫描,若这一行没有灰 度值为255的点,查看标志变量,标志变量为0,则扫描下一4亍;为l,则记录 此行号&,并置标志变量为0;若有灰度值为255的点,查看标志变量;若为0, 把行号记录下来,置标志变量为l;若标志变量为1则继续下一4于扫描;(4.2) 设一标志变量j,并置为O,对所有有记录的行,在顺次两行/z,和、 之间进行列扫描;设当前扫描的列号为"若此列无灰度为255的点,检查j, 若j--O,则扫描下一列;j==l,记录二元组(A,,并令j-O; 若有灰度 值为255的点,检查j,若j-0,则记录二元组(、,4),并令j-l;若j--l, 则继续扫描下一列;(4.3) 步骤(4.2)中得到的顺次相邻两点(V。 C ), 所围成 的矩形区域就是一个字母区域,所有这些区域就组成一个字母区域集合;因 为在识别时需要用到预先存储在相机里的标准字母模板图片,且图片大小是 20*20的,所以要把每一个字母区域规范化成一个20*20大小的区域;规范的 方法为设待规范的区域为n^n大小,对于其中一个像素点(i, j ),令p-取整(i/m*20), q二取整(j/m*20);新建一个20*20图片,令新建图片中(p, q) 点的灰度值为待规范的区域中(i, j)点的灰度值,新建图片中其余点灰度值 全部置为0;这样就把111*11区域转换成20*20区域;(4.4 )把转换后的图片和模板图片进行比对,进而识别出字母;比较的规 则用下面的^^式20 204=Z2X-。2乂=1其中,《为第k个模板图片的(i, j)像素的灰度值,i为当前待测图片的(i, j)像素的灰度值;取值最小的^,它对应的下标就为与被测图片同 类的模板图片号;(4.5)通过步骤(4.4)就可以把图片中的所有字母识别出来,然后以ASCII 码形式存成文本文件,这样就完成了文字提取过程;步骤四相机自动利用现有的翻译算法对文字进行翻译; 步骤五将翻译完的结果显示在LCD上。本专利技术的有益效果是本专利技术可以直接利用现有的数码相机硬件资源, 无需添加任何硬件成本,使得数码相机具有文字提取和自动翻译的功能,能 够给用户带来极大的效益。总之,本专利技术构思合理,效果显著,使用方便,应用广泛。 具体实施例方式以下结合较佳实施例,对依据本专利技术提供的具体实施方式、特征详述如下一种,其特征在于实施步 骤如下步骤一在菜单(Menu)中按相应项,W目机设置成翻译模式; 步骤二对文字进行拍照;步骤三相机自动用文字提取算法进行文字提取,并生成文本文件; 所述文字提取算法如下首先,对文字进行拍摄,通常图片中包括文字和背景两色;(1) 要把彩色图像进行灰度化处理;根据心理学研究得出的人类色彩感 光特性,并考虑计算的速度,采用以下公式,按从左到右,从上到下的顺序 对每个像素点进行灰度化处理y = (229 x及+ 587 xG + 114 x丑+ 50Q)細0;其中,R、 G、 B分别是这个像素点的R、 G、 B值;这样就把彩色图像转 化为灰度图像;(2) 对得到的灰度图像进行二值化处理;首先确定一个阈值,灰度值大 于这个阈值的点灰度值全部置为255,灰度值小于这个阈值的点灰度值全部置 为0;这个阈值a通过如下公式得到a=所有像素点灰度之和/像素点个数;然后按从左到右,从上到下的顺序对图像的每个像素点进行扫描,当该 点灰度值Y〉a时,Y=255;当Y〈a时,Y=0;(3) 比较Y值为0和Y值为255的像素点的个数,个数多的为背景点集合, 个数少的为文字点集合;如果背景点灰度为255,则置背景点灰度为O,文字 点灰度为255 (为保证文字点灰度始终为255 );(4) 对得到的二值化图片进行文字提取;提取的方法是采用如下算法(4.1) 设一标志变量i,并置为O,对图片进行逐行扫描,若这一行没有灰 度值为255的点,查看标志变量,标志变量为O,则扫描下一4亍;为l,则记录 此行号A,,并置标志变量为0;若有灰度值为255的点,查看标志变量;若为O, 把行号记录下来,置标志变量为l;若标志变量为l则继续下一行扫描;(4.2) 设一标志变量j,并置为O,对所有有记录的行,在顺次两行A和/j,—, 之间(例如,有记录的行为第3, 6, 10, 13, 17, 20行,那么就是第3行和第 6行之间,第10和第13行之间,以此类推)进行列扫描;设当前扫描的列号为 々;若此列无灰度为255的点,检查j,若j-O,则扫描下一列;j=l,记录二元 组U, /J,并令j-O; 若有灰度值为255的点,检查j,若j-O,则记录二元 组(ft,一,"),并令〗=1;若〗=1,则继续扫描下一列;(4.3) 步骤(4.2)中得到的顺次相邻两点(、,/m ), ( /z,, / )所围成 的矩形区域就是一个字母区域,所有这些区域就组成一个字母区域集合;因为在识别时需要用到预先存储在相机里的标准字母模板图片,本文档来自技高网...

【技术保护点】
一种实现数码相机文字提取和自动翻译功能的方法,其特征在于实施步骤如下: 步骤一:在菜单中按相应项,把相机设置成翻译模式; 步骤二:对文字进行拍照; 步骤三:相机自动用文字提取算法进行文字提取,并生成文本文件; 所述文字提取算法如下: 首先,对文字进行拍摄,通常图片中包括文字和背景两色; (1)要把彩色图像进行灰度化处理;根据心理学研究得出的人类色彩感光特性,并考虑计算的速度,采用以下公式,按从左到右,从上到下的顺序对每个像素点进行灰度化处理: Y=(229×R+587×G+114×B+500)/1000; 其中,R、G、B分别是这个像素点的R、G、B值;这样就把彩色图像转化为灰度图像; (2)对得到的灰度图像进行二值化处理;首先确定一个阈值,灰度值大于这个阈值的点灰度值全部置为255,灰度值小于这个阈值的点灰度值全部置为0;这个阈值α通过如下公式得到: α=所有像素点灰度之和/像素点个数; 然后按从左到右,从上到下的顺序对图像的每个像素点进行扫描,当该点灰度值Y≥α时,Y=255;当Y<α时,Y=0; (3)比较Y值为0和Y值为255的像素点的个数,个数多的为背景点集合,个数少的为文字点集合;如果背景点灰度为255,则置背景点灰度为0,文字点灰度为255;保证文字点灰度始终为255; (4)对得到的二值化图片进行文字提取;提取的方法是采用如下算法: (4.1)设一标志变量i,并置为0,对图片进行逐行扫描,若这一行没有灰度值为255的点,查看标志变量,标志变量为0,则扫描下一行;为1,则记录此行号hi,并置标志变量为0;若有灰度值为255的点,查看标志变量;若为0,把行号记录下来,置标志变量为1;若标志变量为1则继续下一行扫描; (4.2)设一标志变量j,并置为0,对所有有记录的行,在顺次两行h↓[i]和h↓[i-1]之间进行列扫描;设当前扫描的列号为l↓[k];若此列无灰度为255的点,检查j,若j=0,则扫描下一列;j=1,记录二元组(h↓[i],l↓[k]),并令j=0;若有灰度值为255的点,检查j,若j=0,则记录二元组(h↓[i-1],l↓[k]),并令j=1;若j=1,则继续扫描下一列;(4.3)步骤(4.2)中得到的顺次相邻两点(h↓[i-1],l↓[m]),(h↓[i],l↓[n])所围成的矩形区域就是一个字母区域,所有这些区域就组成一个字母区域集合;因为在识别时需要用到预先存储在相机里的标准字...

【技术特征摘要】

【专利技术属性】
技术研发人员:王真郑龙周
申请(专利权)人:天津三星光电子有限公司
类型:发明
国别省市:12[中国|天津]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利