基于摄像头的汉字识别方法技术

技术编号:13171604 阅读:25 留言:0更新日期:2016-05-10 14:57
本发明专利技术涉及文字识别技术,目的是为了解决现有的汉字识别方法操作繁琐不易控制的问题。本发明专利技术提供的基于摄像头的汉字识别方法的步骤如下:打开摄像头,获取包含所需识别汉字的画面。点击所需识别的汉字,同时获取当前帧与点击位置。获取帧上汉字大小,根据汉字大小计算识别范围。截取帧上范围内画面,通过图片识别技术得到范围内的汉字。在屏幕右边罗列识别到的汉字,同时在屏幕上方推荐最可能的汉字给用户,显示其基本信息。用户点击一旁的“更多”按钮获取推荐汉字的详细信息。若推荐汉字不符合,则用户可点击屏幕右边所罗列的汉字,点击所需汉字,将显示其详细信息。本发明专利技术适用于汉字识别。

【技术实现步骤摘要】

本专利技术涉及文字识别技术,特别涉及。
技术介绍
目前通过手机摄像头识别汉字的方法大致有两种,一种是通过摄像头框取,然后扫描并识别汉字的方法;一种是通过先拍得一张包含所需汉字的图片,然后通过涂抹所要识别汉字,再将涂抹区域进行识别的方法。第一种需要用户不断调整摄像头的上下距离和左右位置来框取,并点击确认来获取所要识别的汉字,其操作不好控制;第二种需要先获取照片并涂抹,其步骤过多且涂抹位置不好把握。
技术实现思路
本专利技术的目的是为了解决现有的汉字识别方法操作繁琐不易控制的问题。为达到上述目的,本专利技术提供一种,其特征在于,包括如下步骤:A.通过摄像头获取包含所需要识别汉字的完整画面;B.用户在屏幕上点击所需识别的汉字画面,系统获取所述画面的当前一帧,同时记录用户点击的位置的坐标(x,y);C.通过图片文字识别技术得到所获取的帧上汉字相对于屏幕分辨率下的字体大小d;D.计算得到汉字的识别矩阵范围,同时在所述画面上标注所述识别矩阵范围,所述识别矩阵范围左上角坐标为(x-d,y-d),右下角坐标为(x+d,y+d);E.在获取到的帧上截取所述识别矩阵范围内的图片,通过图片文字识别技术识别所截取图片内的汉字,利用互联网文字库获取汉字的基本信息,连同所识别出的汉字一同在屏幕上进行显示。具体地,通过图片文字识别技术识别所截取图片内的汉字时,根据概率在屏幕上依次罗列识别到的汉字。具体地,若所罗列的汉字都不是摄像头所获取的汉字,则重新进入步骤A。本专利技术中,进行操作的设备可以是任何带有摄像头的智能终端设备,例如智能手机、智能平板电脑等。本专利技术中的图片文字识别技术为现有技术,例如百度、谷歌等的图片文字识别技术。本专利技术的有益效果是:本专利技术提供的,用户通过带有摄像头的智能终端设备,在获取汉字的图像后,即可以智能地获取汉字对应的基本信息,并通过智能终端的显示屏幕进行显示。【具体实施方式】以下通过具体实例对本专利技术的技术方案作进一步详细描述。本专利技术为解决现有的汉字识别方法操作繁琐不易控制的问题,提供一种,该方法包括如下步骤:A.通过摄像头获取包含所需要识别汉字的完整画面;B.用户在屏幕上点击所需识别的汉字画面,系统获取所述画面的当前一帧,同时记录用户点击的位置的坐标(x,y);C.通过图片文字识别技术得到所获取的帧上汉字相对于屏幕分辨率下的字体大小d;D.计算得到汉字的识别矩阵范围,同时在所述画面上标注所述识别矩阵范围,所述识别矩阵范围左上角坐标为(x-d,y-d),右下角坐标为(x+d,y+d);E.在获取到的帧上截取所述识别矩阵范围内的图片,通过图片文字识别技术识别所截取图片内的汉字,利用互联网文字库获取汉字的基本信息,连同所识别出的汉字一同在屏幕上进行显示。以下对用户通过智能终端采用本专利技术的方法获取汉字及其基本信息的过程进行一示例性说明。首先,用户打开摄像头,获取包含所需识别汉字的画面,在操作时,应当注意尽量使摄像头包含整个汉字。然后,在智能终端的屏幕上点击所需识别的汉字,同时获取当前帧与点击位置。之后,通过图片识别技术获取帧上汉字大小,根据汉字大小计算识别范围。在确定识别范围后,截取帧上范围内画面,通过图片识别技术得到范围内的汉字。本专利技术的方法,识别出汉字之后在屏幕右边罗列识别到的汉字,同时在屏幕上方推荐最可能的汉字给用户,显示其基本信息。用户可以点击一旁的“更多”按钮获取推荐汉字的详细信息。若推荐汉字不符合,则用户可点击屏幕右边所罗列的汉字,点击所需汉字,将显示其详细信息。若无一字符合,则可点击右下角的“重新点击”按钮重新点击要识别的汉字。本专利技术中,由于需要使用汉字库获取汉字及其基本的信息,因此,一般情况下,本专利技术的智能终端必须具备网络连接功能,只有在智能终端与汉字库连接之后,才能获取汉字及其基本信息,否则,智能终端必须具备庞大的数据存储功能用以存储汉字库。【主权项】1.,其特征在于,包括如下步骤: A.通过摄像头获取包含所需要识别汉字的完整画面; B.用户在屏幕上点击所需识别的汉字画面,系统获取所述画面的当前一帧,同时记录用户点击的位置的坐标(x,y); C.通过图片文字识别技术得到所获取的帧上汉字相对于屏幕分辨率下的字体大小d; D.计算得到汉字的识别矩阵范围,同时在所述画面上标注所述识别矩阵范围,所述识别矩阵范围左上角坐标为(x-d,y-d),右下角坐标为(x+d,y+d); E.在获取到的帧上截取所述识别矩阵范围内的图片,通过图片文字识别技术识别所截取图片内的汉字,利用互联网文字库获取汉字的基本信息,连同所识别出的汉字一同在屏幕上进行显示。2.如权利要求1所述的,其特征在于,步骤E中,通过图片文字识别技术识别所截取图片内的汉字时,根据概率在屏幕上依次罗列识别到的汉字。3.如权利要求1所述的,其特征在于,步骤E中,若所罗列的汉字都不是摄像头所获取的汉字,则重新进入步骤A。【专利摘要】本专利技术涉及文字识别技术,目的是为了解决现有的汉字识别方法操作繁琐不易控制的问题。本专利技术提供的的步骤如下:打开摄像头,获取包含所需识别汉字的画面。点击所需识别的汉字,同时获取当前帧与点击位置。获取帧上汉字大小,根据汉字大小计算识别范围。截取帧上范围内画面,通过图片识别技术得到范围内的汉字。在屏幕右边罗列识别到的汉字,同时在屏幕上方推荐最可能的汉字给用户,显示其基本信息。用户点击一旁的“更多”按钮获取推荐汉字的详细信息。若推荐汉字不符合,则用户可点击屏幕右边所罗列的汉字,点击所需汉字,将显示其详细信息。本专利技术适用于汉字识别。【IPC分类】G06K9/32【公开号】CN105488504【申请号】CN201511005440【专利技术人】汪靖博 【申请人】四川长虹网络科技有限责任公司【公开日】2016年4月13日【申请日】2015年12月28日本文档来自技高网...

【技术保护点】
基于摄像头的汉字识别方法,其特征在于,包括如下步骤:A.通过摄像头获取包含所需要识别汉字的完整画面;B.用户在屏幕上点击所需识别的汉字画面,系统获取所述画面的当前一帧,同时记录用户点击的位置的坐标(x,y);C.通过图片文字识别技术得到所获取的帧上汉字相对于屏幕分辨率下的字体大小d;D.计算得到汉字的识别矩阵范围,同时在所述画面上标注所述识别矩阵范围,所述识别矩阵范围左上角坐标为(x‐d,y‐d),右下角坐标为(x+d,y+d);E.在获取到的帧上截取所述识别矩阵范围内的图片,通过图片文字识别技术识别所截取图片内的汉字,利用互联网文字库获取汉字的基本信息,连同所识别出的汉字一同在屏幕上进行显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:汪靖博
申请(专利权)人:四川长虹网络科技有限责任公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1