一种基于部件的联机手写藏文字符的识别方法技术

技术编号：7178878 阅读：268 留言：0更新日期：2012-04-11 18:40

本发明专利技术属于少数民族语言文字信息处理领域，具体涉及一种基于部件的联机手写藏文字符的识别方法。本发明专利技术突破传统的基于统计的识别方法，以部件为基本识别对象，首先对输入字符进行部件分割，得到按一定规则排列的子结构序列，然后利用基于条件随机场的集成识别方法，从子结构序列中获取正确的部件串分割点及部件串的识别结果，基于此识别结果最终确定字符的类别。本发明专利技术用于基于笔式交互的移动设备的手写识别输入，识别方法的存储量小、识别精度较高，能够满足笔式移动设备的高需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于少数民族语言文字信息处理的联机手写字符识别领域，涉及一种藏文字符的识别方法，尤其涉及。
技术介绍
基于笔的联机手写字符识别技术是一种易被用户使用的、有效的实时工具，已广泛应用在计算机和手持移动设备(如手机、PDA等)中。笔输入设备的普及和应用的扩展，给手写字符识别技术的应用带来了新的机遇，同时又对识别性能提出了更高的要求。进一步提高识别精度、减少计算量和存储空间是下一步的研究目标。藏文字符识别技术是少数民族语言文字信息处理中的重要部分，但目前国内外在联机手写藏文字符识别上的研究相对较少，因而，研究联机手写藏文字符的识别方法在理论和应用上都具有重要的意义。传统的字符识别方法包括统计方法和结构方法。统计方法通常用特征向量表示整个字符形状信息，用统计分类器进行字符分类，这种方法能够克服笔划顺序和笔划数的变化，识别精度较高；但由于字符的类别数大，分类器参数的存储量也很大。结构方法是将字符分解为简单的子结构(部件、笔划等)，用相对简单的方法对子结构进行识别。这种方法的优点是结构基元的模型复杂度低，而缺点是子结构提取的难度大，准确性低。目前联机手写藏文字符识别的研究均是采用基于统计的方法，藏文字符的类别数大，导致分类器参数的存储量大；另一方面，相似字符的类别数多，影响了分类器的识别精度；这两个主要原因导致藏文字符的识别性能尚未达到笔式移动设备对手写识别技术的较高需求。
技术实现思路
本专利技术的目的是为满足目前笔式移动设备对手写藏文识别技术的较高需求，提出。本专利技术的基于部件的联机手写藏文字符的识别方法，其步骤包括1)对输入字符的点轨迹进行预处理；2)...

【技术保护点】
１．一种基于部件的联机手写藏文字符的识别方法，其步骤包括：１）对输入字符的点轨迹进行预处理；２）对预处理后的字符进行部件分割，得到一系列子结构块；３）将子结构块按其边界框的上边界重新排列，得到子结构块序列；４）采用基于条件随机场的集成识别方法，从子结构块序列中识别出正确的部件串；所述基于条件随机场的集成识别方法通过不同的权值将字符－部件的组成规则模型、部件分类模型、字符的拼写规则模型及几何模型集成在一起；５）根据识别出的部件串确定输入的字符。

【技术特征摘要】

【专利技术属性】
技术研发人员：马龙龙，吴健，刘汇丹，
申请(专利权)人：中国科学院软件研究所，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人