文字信息的识别方法和装置制造方法及图纸

技术编号：11415166 阅读：78 留言：0更新日期：2015-05-06 15:01

本发明专利技术提出了一种文字信息的识别方法和装置，其中，文字信息的识别方法，包括：接收用户输入的文字信息，并从文字信息中获取到对应的元素；基于元素生成识别结果集合；以及基于预设算法对识别结果集合中的识别结果进行处理，以输出目标识别结果。本发明专利技术实施例的文字信息的识别方法和装置，通过笔画预分割器准确地对用户输入的文字信息进行笔画分割获取到对应的元素，并根据相似度生成识别结果集合，以及根据预设语言模型构造马尔可夫链，获取其中生成概率最高的路径对应的信息作为目标识别结果，在用户不受限地在手写区域输入文字信息的情况下，能够准确地识别用户输入的文字信息，有效地提高了识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
文字信息的识别方法和装置
本专利技术涉及计算机
，尤其涉及一种文字信息的识别方法和装置。
技术介绍
手写识别是指将手写输入时产生的有序轨迹信息转化为文字信息的过程，即手写轨迹的坐标序列到文字信息的一个映射过程，是人机交互最自然、最方便的手段之一。随着智能手机、平板电脑等智能工具的普及，手写识别技术的应用也越来越广泛。目前，很多输入法应用软件都支持手写输入方式，用户可通过手写输入笔画序列，应用软件可将笔画序列识别为文字信息，从而实现文字的输入。但是，如果用户一下输入多个文字，且输入的方式不是正常的从左至右的输入方式，而是例如从下至上等非正常的输入方式，就会降低文字信息的识别率。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的一个目的在于提出一种文字信息的识别方法。该方法在用户不受限地在手写区域输入文字信息的情况下，能够准确地识别用户输入的文字信息，有效地提高了识别的准确率。本专利技术的第二个目的在于提出一种文字信息的识别装置。为达上述目的，根据本专利技术第一方面实施例提出了一种文字信息的识别方法，包括：接收用户输入的文字信息，并从所述文字信息中获取到对应的元素；基于所述元素生成识别结果集合；以及基于预设算法对所述识别结果集合中的识别结果进行处理，以输出目标识别结果。本专利技术实施例的文字信息的识别方法，通过笔画预分割器准确地对用户输入的文字信息进行笔画分割获取到对应的元素，并根据相似度生成识别结果集合，以及根据预设语言模型构造马尔可夫链，获取其中生成概率最高的路径对应的信息作为目标识别结果，在用户不受限地在手写...

【技术保护点】
一种文字信息的识别方法，其特征在于，包括：接收用户输入的文字信息，并从所述文字信息中获取到对应的元素；基于所述元素生成识别结果集合；以及基于预设算法对所述识别结果集合中的识别结果进行处理，以输出目标识别结果。

【技术特征摘要】
1.一种文字信息的识别方法，其特征在于，包括：接收用户输入的文字信息，并从所述文字信息中获取到对应的元素；基于所述元素生成识别结果集合；以及基于预设算法对所述识别结果集合中的识别结果进行处理，以输出目标识别结果；其中，所述基于预设算法对所述识别结果集合中的识别结果进行处理，以输出目标识别结果，包括：根据所述预设语言模型和所述识别结果集合构造马尔可夫链，其中，马尔可夫链包括至少一个路径；计算出每条路径的生成概率，将所述生成概率最高的路径对应的信息作为所述目标识别结果并输出；所述计算出每条路径的生成概率，包括：针对每条路径，获得当前路径上的识别结果的分布概率和状态转移概率，根据获得的所述分布概率和所述状态转移概率计算出当前路径的生成概率；所述基于所述元素生成识别结果集合，包括：对所述元素进行识别，获得初步识别结果；以及计算初步识别结果中的字符与预设字库中字符的相似度，从所述初步识别结果中删除相似度低于预设阈值的字符，以及计算所述初步识别结果中的字符之间的相对相似度，删除不相似的识别结果，以获得所述识别结果集合；所述预设字库包括笔迹模型库；字符之间的相对相似度，指的是将所述初步识别结果中的多个字符与预设字库中相同字符之间的相似度进行比对，得到的相似度。2.根据权利要求1所述的方法，其特征在于，所述从所述文字信息中获取到对应的元素，包括：通过笔画预分割器对所述文字信息进行...

【专利技术属性】
技术研发人员：李瑾，徐翔，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人