一种识别繁体字并学习的方法及装置制造方法及图纸

技术编号:17407860 阅读:36 留言:0更新日期:2018-03-07 05:25
本发明专利技术涉及繁体字教学技术领域,具体是一种识别繁体字并学习的方法及装置,所述方法包括下述步骤:当需要进行扫描时,打开扫描单元的扫描开关进行扫描;将扫描得到的图片发送至数据处理单元进行处理,通过对比数据库识别出图片中的繁体字;数据处理单元将所识别出的繁体字发送至发音单元,发音单元对繁体字的读音进行发音播放,同时,数据处理单元将所识别出的繁体字发送至显示单元,显示单元显示出该繁体字的字义。本发明专利技术通过将扫描到的文字图片对比数据库从而识别出图片中繁体字,还可以从服务器中获取该繁体字的关联语句,并能语音播报和词义显示,以加深对该繁体字的记忆以及理解,从而达到教学的目的。

A method and device for identifying and learning traditional characters

The present invention relates to the technical field of traditional Chinese teaching, in particular to a method and device for identification of characters and learning, the method comprises the following steps: when the need for scanning, scanning switch scanning unit to scan; the obtained pictures are transmitted to the data processing unit for processing, by comparing the database to identify the picture of the traditional Chinese characters; traditional Chinese characters pronunciation unit sent to the data processing unit to identify the pronunciation of traditional word pronunciation unit pronunciation play, at the same time, the characters sent to the display unit the data processing unit will be identified, the display unit displays the word meaning. The present invention by comparing database text images scanned to identify images in traditional Chinese characters, but also can obtain the related statements of traditional Chinese characters from the server, and can display the speech and meaning, to deepen the traditional Chinese characters in the memory and understanding, so as to achieve the purpose of teaching.

【技术实现步骤摘要】
一种识别繁体字并学习的方法及装置
本专利技术涉及繁体字教学
,具体是一种识别繁体字并学习的方法及装置。
技术介绍
在阅读古文经典书籍、观看港澳台频道时会遇到许多生僻的繁体字,由于现代教育方式的不同,大多数的读者或者观众对这些繁体字都缺乏了解,为了方便这类人群以及其他热爱古文繁体字的人群进行学习,本专利技术提供了一种识别繁体字并学习的方法及装置,以满足广大受众的实际需求。
技术实现思路
本专利技术的目的是提供一种识别繁体字并学习的方法及装置,旨在提供一种识别繁体字并学习的方法,该方法通过扫描单元对文字进行扫描,将扫描到的文字图片发送到数据处理单元进行处理,通过对比数据库识别出图片中繁体字,并通过发音单元发出该繁体的读音,同时通过显示单元显示出该繁体字的字义,还可以通过无线通讯单元连接服务器,从服务器中获取该繁体字的关联语句,达到教学的目的。本专利技术实现专利技术目的采用如下技术方案:一种识别繁体字并学习的方法及装置,其特征在于,具体包括如下步骤:步骤1:通过扫描单元对预定区域进行扫描;当需要对预定区域进行扫描时,打开扫描开关进行扫描。步骤2:将扫描得到的图片发送至数据处理单元进行处理,通过对比数据库识别出图片中的繁体字;步骤2.1:将扫描得到的文字图片进行预处理;步骤2.1.1:将彩色图像转化为仅包含像素亮度信息的灰度图;步骤2.1.2:采用领域平均滤波法对图像像素进行噪声去除,消除诸如标点符号等一些随机的小的噪音;步骤2.2:对图像进行分类处理;由于文字的像素值与图像的像素值不同,根据像素进行k-means分类处理,并设置像素阈值,低于像素阈值的判定为不是文字,反之则判定为文字。步骤2.2.1:设图像的像素大小为Cx*Cy,对图像进行像素空间分类,将其分类为k个子空间,每个子空间的中心点为Pi,i∈(1,2···k);步骤2.2.2:计算每个子空间的像素点到其中心点的欧式距离:步骤2.2.3:按照最小距离原则对像素进行分类,得到k个像素点集合Qi,i=(1,2···k);步骤2.2.4:随机选择两个子空间集合Qx与Qy(x,y∈[1,k]),计算Qx与Qy的最小距离,并将Qx中取最小距离的点移入Qy;步骤2.2.5:重复步骤2.2.4,直至每个子空间中的像素点不发生变化为止;步骤3:设定像素点的最低阈值,低于阈值的块图像则视为非汉字,反之视为汉字;步骤4:设定汉字之间的最小列间距ω,当相邻块图像之间的列间距大于ω时,视为两个汉字;步骤5:对识别出的汉字块图像进行提取,并发送至数据库进行模糊识别,识别出具体的汉字块所对应的繁体字内容;步骤6:数据处理单元将所识别出的繁体字发送至发音单元,发音单元对繁体字的读音进行发音播放;数据处理单元将所识别出的繁体字发送至显示单元,显示单元显示出该繁体字的字义;步骤7:通过无线通讯单元连接服务器,从服务器中获取该繁体字的关联语句,并在显示单元中进行显示,还可以通过无线通讯单元将数据处理单元无法识别的繁体字发送至服务器进行识别,服务器将识别结果通过无线通讯单元反馈给数据处理单元,由数据处理单元进行处理,并发送至发音单元和显示单元。有益效果:本专利技术的有益效果是通过一种识别繁体字并学习的方法及装置,提供一种识别繁体字并为学习的方法,该方法通过扫描单元对文字进行扫描,将扫描到的文字图片发送到数据处理单元进行处理,通过对比数据库识别出图片中繁体字,并通过发音单元发出该繁体的读音,同时通过显示单元显示出该繁体字的字义,还可以通过无线通讯单元连接服务器,从服务器中获取该繁体字的关联语句,达到教学的目的。附图说明图1是本专利技术第一实施例提供的一种识别繁体字并学习的方法的实现流程图;图2是本专利技术第二实施例提供的一种识别繁体字并学习的方法的实现流程图;图3是本专利技术第三实施例提供的一种识别繁体字并学习的装置的结构图。具体实施方式以下通过具体实施例对本专利技术做进一步解释说明。实施例一:图1示出了本专利技术第一实施例提供的一种控制列表界面的方法的实现流程,具体如下:S101,当需要进行扫描时,打开扫描单元的扫描开关进行扫描。当需要对预定区域进行扫描时,打开扫描开关进行手动扫描。S102,将扫描得到的图片发送至数据处理单元进行处理,通过对比数据库识别出图片中的繁体字。将扫描得到的文字图片进行预处理;将彩色图像转化为仅包含像素亮度信息的灰度图;采用领域平均滤波法对图像像素进行噪声去除,消除诸如标点符号等一些随机的小的噪音;对图像进行分类处理;由于文字的像素值与图像的像素值不同,根据像素进行k-means分类处理,并设置像素阈值,低于像素阈值的判定为不是文字,反之则判定为文字。设图像的像素大小为Cx*Cy,对图像进行像素空间分类,将其分类为k个子空间,每个子空间的中心点为Pi,i∈(1,2···k);计算每个子空间的像素点到其中心点的欧式距离:按照最小距离原则对像素进行分类,得到k个像素点集合Qi,i=(1,2···k);随机选择两个子空间集合Qx与Qy(x,y∈[1,k]),计算Qx与Qy的最小距离,并将Qx中取最小距离的点移入Qy;直至每个子空间中的像素点不发生变化为止;设定像素点的最低阈值,低于阈值的块图像则视为非汉字,反之视为汉字;设定汉字之间的最小列间距ω,当相邻块图像之间的列间距大于ω时,视为两个汉字;对识别出的汉字块图像进行提取,并发送至数据库进行模糊识别,识别出具体的汉字块所对应的繁体字内容。S103,数据处理单元将所识别出的繁体字发送至发音单元,发音单元对繁体字的读音进行发音播放;数据处理单元将所识别出的繁体字发送至显示单元,显示单元显示出该繁体字的字义。本专利技术实施例通过上述方式,一种识别繁体字并学习的方法,通过扫描单元对文字进行扫描,将扫描到的文字图片发送到数据处理单元进行处理,对比数据库识别出图片中繁体字,并通过发音单元发出该繁体的读音,同时通过显示单元显示出该繁体字的字义,还可以通过无线通讯单元连接服务器,从服务器中获取该繁体字的关联语句,达到教学的目的。实施例二:图2示出了专利技术第二实施例提供的一种识别繁体字并学习的方法的实现流程,具体如下:S201,当需要对预定区域进行扫描时,打开扫描开关进行手动扫描。当用户需要进行扫描时,打开扫描单元的扫描开关,此时扫描单元处于工作状态,用户可以手动对需要进行扫描的区域进行扫描。S202,将扫描得到的文字图片进行预处理。将彩色图像转化为仅包含像素亮度信息的灰度图;采用领域平均滤波法对图像像素进行噪声去除,消除诸如标点符号等一些随机的小的噪音;对图像进行分类处理;由于文字的像素值与图像的像素值不同,根据像素进行k-means分类处理,并设置像素阈值,低于像素阈值的判定为不是文字,反之则判定为文字。设图像的像素大小为Cx*Cy,对图像进行像素空间分类,将其分类为k个子空间,每个子空间的中心点为Pi,i∈(1,2···k);计算每个子空间的像素点到其中心点的欧式距离:按照最小距离原则对像素进行分类,得到k个像素点集合Qi,i=(1,2···k);随机选择两个子空间集合Qx与Qy(x,y∈[1,k]),计算Qx与Qy的最小距离,并将Qx中取最小距离的点移入Qy;直至每个子空间中的像素点不发生变化为止;设定像素点的最低阈值,低于阈值的块图像则视为非汉字,反之视本文档来自技高网...
一种识别繁体字并学习的方法及装置

【技术保护点】
一种识别繁体字并学习的方法,其特征在于,所述方法包括如下步骤:当需要进行扫描时,打开扫描单元的扫描开关进行扫描;将扫描得到的图片发送至数据处理单元进行处理,通过对比数据库识别出图片中的繁体字;数据处理单元将所识别出的繁体字发送至发音单元,发音单元对繁体字的读音进行发音播放,同时,数据处理单元将所识别出的繁体字发送至显示单元,显示单元显示出该繁体字的字义。

【技术特征摘要】
1.一种识别繁体字并学习的方法,其特征在于,所述方法包括如下步骤:当需要进行扫描时,打开扫描单元的扫描开关进行扫描;将扫描得到的图片发送至数据处理单元进行处理,通过对比数据库识别出图片中的繁体字;数据处理单元将所识别出的繁体字发送至发音单元,发音单元对繁体字的读音进行发音播放,同时,数据处理单元将所识别出的繁体字发送至显示单元,显示单元显示出该繁体字的字义。2.如权利要求1所述的方法,其特征在于,所述的当需要进行扫描时,打开扫描单元的扫描开关进行扫描的步骤包括:当需要对预定区域进行扫描时,打开扫描开关进行手动扫描。3.如权利要求1所述的方法,其特征在于,所述的将扫描得到的图片发送至数据处理单元进行处理,通过对比数据库识别出图片中的繁体字的步骤包括:将扫描得到的文字图片进行预处理;将彩色图像转化为仅包含像素亮度信息的灰度图;采用领域平均滤波法对图像像素进行噪声去除,消除诸如标点符号等一些随机的小的噪音;对图像进行分类处理;由于文字的像素值与图像的像素值不同,根据像素进行k-means分类处理,并设置像素阈值,低于像素阈值的判定为不是文字,反之则判定为文字;设图像的像素大小为Cx*Cy,对图像进行像素空间分类,将其分类为k个子空间,每个子空间的中心点为Pi,i∈(1,2…k);计算每个子空间的像素点到其中心点的欧式距离:按照最小距离原则对像素进行分类,得到k个像素点集合Qi,i=(1,2…k);随机选择两个子空间集合Qx与Qy(x,y∈[1,k]),计算Qx与Qy的最小距离,并将Qx中取最小距离的点移入Qy;直至每个子空间中的像素点不发生变化为止;设定像素点的最低阈值,低于阈值的块图像则视为非汉字,反之视为汉字;设定汉字之间的最小列间距ω,当相邻块图像之间的列间距大于ω时,视为两个汉字;对识别出的汉字块图像进行提取,并发送至数据库进行模糊识别,识别出具体的汉字块所对应的繁体字...

【专利技术属性】
技术研发人员:李敬兆张智俊
申请(专利权)人:安徽理工大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1