一种文字识别输出方法及系统技术方案

技术编号:9642730 阅读:105 留言:0更新日期:2014-02-07 01:42
本发明专利技术公开了一种文字识别输出方法系统,本发明专利技术中由手写板终端完成对手写文字的分段扫描,而由云服务器并行完成对扫描后分段扫描图像的文字识别及合并,实现了在手写板终端手写输入的同时进行文字识别,缩短了文字识别的处理时间,实时地完成了对手写文稿的识别输出;而且,由于云服务器相对于手写板终端来讲,功能更为强大,比如通过保存多个手写板终端的历史识别样本库,结合多种语言样本库,以及多段落语义识别,保证了文字识别正确率。

【技术实现步骤摘要】
一种文字识别输出方法及系统
本专利技术涉及手写体技术,尤指一种文字识别输出方法及系统。
技术介绍
目前,手写体文字识别输出包括联机文字识别输出和脱机文字识别输出两种。其中,联机文字识别输出是通过辨别文字书写轨迹并结合用户的选择确认完成的文字识别输出,脱机文字识别输出则是通过光学扫描等形成图像后,再通过计算机的文字识别完成的文字识别输出。对于联机文字识别输出,往往需要用户逐字或者几个字一起选择确认,对于手写文字来说,联机书写速度较慢。而脱机文字识别输出则由于对样本数据库和处理能力的要求较高,因此,其对处理计算机的要求较高,而且通常处理时间较长,因此通常仅适用于非实时处理的大批量文稿。如果用户希望能够在手写板上流畅书写中等大小篇幅的文字,比如一篇博客日记、一篇新闻稿等,同时,又希望能够在书写结束后实时得到标准印刷体文字输出。这显然需要文字识别输出的处理时间短且识别正确率高,而现有联机文字识别输出或脱机文字识别输出均无法同时满足处理时间短且识别正确率高的要求。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种文字识别输出方法及系统,能够缩短文字识别的处理时间,而且保证识别正确率。为了达到本专利技术目的,本专利技术提供了一种文字识别输出方法,包括:手写板终端将输入的文字信息进行分段并生成分段扫描图像后发送给云服务器;云服务器根据统计识别和结构识别方法,完成对分段扫描图像的文字识别,合并从各分段扫描图像识别出的文字并发送给手写板终端显示。所述分段的大小根据手写所用时长、扫描图像传输时长和文字识别处理时长来决定。在所述分段扫描图像发送给云服务器之前,该方法还包括:对每个所述分段顺序进行编号,并为最后一个分段的分段扫描图像的编号设置结束标识。所述合并从各分段扫描图像识别出的文字包括:所述云服务器按照分段的编号,将识别出的印刷体文字顺序排列,直到最后一个分段文字。该方法还包括:所述手写板终端存储手写输入的文字,各分段扫描图像和云服务器返回的印刷体文字;所述云服务器存储来自手写板终端的分段扫描图像,和分段文字识别后的印刷体文字。本专利技术还提供一种文字识别输出系统,至少包括手写板终端,云服务器,其中,手写板终端,用于接收手写输入,并将输入的文字信息进行分段并分段扫描成图像后发送给云服务器;显示来自云服务器的文字信息;云服务器,用于根据统计识别和结构识别方法,完成对分段扫描图像的文字识别,合并从各分段扫描图像识别出的文字并发送给手写板终端。所述手写板终端至少包括第一输入模块、第一处理模块、第一输出模块,以及显示模块;其中,第一输入模块,用于接收来自外部的手写输入;接收来自云服务器的印刷体文字;第一处理模块,用于将输入的文字信息进行分段并分段扫描成图像;第一输出模块,用于将分段扫描成图像输出给云服务器;显示模块,用于显示云服务器返回的印刷体文字信息。所述手写板终端还包括第一存储模块,用于存储手写输入的文字,各分段扫描图像和云服务器返回的印刷体文字。所述云服务器至少包括第二输入模块、第二处理模块,第二输出模块;其中,第二输入模块,用于接收来自手写板终端的分段扫描图像;第二处理模块,用于根据统计识别和结构识别方法,完成对分段扫描图像的文字识别,合并从各分段扫描图像识别出的印刷体文字;第二输出模块,用于将识别出的印刷体文字输出给手写板终端。所述云服务器还包括第二存储模块,用于存储来自手写板终端的分段扫描图像,和分段文字识别后的印刷体文字。与现有技术相比,本专利技术文字识别方法中,由手写板终端完成对手写文字的分段扫描,而由云服务器并行完成对扫描后分段扫描图像的文字识别及合并,实现了在手写板终端手写输入的同时进行文字识别,缩短了文字识别的处理时间,实时地完成了对手写文稿的识别输出;而且,由于云服务器相对于手写板终端来讲,功能更为强大,比如通过保存多个手写板终端的历史识别样本库,结合多种语言样本库,以及多段落语义识别,进一步保证了文字识别正确率。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术文字识别输出方法的流程图;图2为本专利技术文字识别输出系统的组成结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1为本专利技术文字识别输出方法的流程图,如图1所示,包括:步骤100:手写板终端将输入的文字信息进行分段并生成分段扫描图像后发送给云服务器。本步骤中,用户在手写板终端上输入的手写字,可包括多语言文字、数字、符号等。本步骤中,分段的大小可以根据手写所用时长、扫描图像传输时长和文字识别处理时长来决定。特别地,对于某个分段,在手写所用时长约等于分段的扫描图像传输时长和文字识别处理时长之和时,系统处理时间最短。生成分段扫描图像的具体实现属于本领域技术人员的常用技术手段,这里不再赘述。进一步地,还包括对每个分段顺序进行编号,并且在手写文字完成全部输入后,最后一个分段的扫描图像的编号设置有结束(end)标识。步骤101:云服务器根据统计识别和结构识别方法,完成对分段扫描图像的文字识别。本步骤中,统计识别和结构识别方法是现有技术,本领域技术人员都知道,统计识别和结构识别是针对单个字的识别,因此本专利技术在此基础上,加入语义识别,并结合多个样本库,比如多语言样本库、符号库、数字库、多手写板终端的历史样本库,对分段扫描图像的文字识别,以实现结合句子的上下文语境、语义进行文字的进一步识别。语义识别的具体实现属于本领域技术人员的惯用技术手段,这里不再赘述。步骤102:云服务器合并从各分段扫描图像识别出的文字并发送给手写板终端显示。本步骤中,云服务器按照分段的编号,将识别出的印刷体文字顺序排列,直到最后一个分段文字。从本专利技术方法可见,本专利技术文字识别方法中,由手写板终端完成对手写文字的分段扫描,而由云服务器并行完成对扫描后分段扫描图像的文字识别及合并,实现了在手写板终端手写输入的同时进行文字识别,缩短了文字识别的处理时间,实时地完成了对手写文稿的识别输出;而且,由于云服务器相对于手写板终端来讲,功能更为强大,比如通过保存多个手写板终端的历史识别样本库,结合多种语言样本库,以及多段落语义识别,进一步保证了文字识别正确率。本专利技术还包括:手写板终端存储手写输入的文字,各分段扫描图像和云服务器返回的印刷体文字。云服务器存储来自手写板终端的分段扫描图像,和分段文字识别后的印刷体文字。需要说明的是,本申请提供的方法还可以与对印刷体文字的识别一同使用,对于如何区分手写体及印刷体文字属于现有技术。图2为本专利技术文字识别输出系统的组成结构示意图,如图2所示,至少包括手写板终本文档来自技高网...
一种文字识别输出方法及系统

【技术保护点】
一种文字识别输出方法,其特征在于,包括:手写板终端将输入的文字信息进行分段并生成分段扫描图像后发送给云服务器;云服务器根据统计识别和结构识别方法,完成对分段扫描图像的文字识别,合并从各分段扫描图像识别出的文字并发送给手写板终端显示。

【技术特征摘要】
1.一种文字识别输出方法,其特征在于,包括:手写板终端将输入的文字信息进行分段并生成分段扫描图像后发送给云服务器;云服务器根据统计识别和结构识别方法,完成对分段扫描图像的文字识别,合并从各分段扫描图像识别出的文字并发送给手写板终端显示;在所述分段扫描图像发送给云服务器之前,该方法还包括:对每个所述分段顺序进行编号,并为最后一个分段的分段扫描图像的编号设置结束标识;所述对分段扫描图像的文字识别具体包括:结合多个样本库,对分段扫描图像的文字识别;所述分段的大小根据手写所用时长、扫描图像传输时长和文字识别处理时长来决定;云服务器完成对分段扫描图像的文字识别,具体包括:云服务器并行完成对扫描后分段扫描图像的文字识别。2.根据权利要求1所述的文字识别输出方法,其特征在于,所述合并从各分段扫描图像识别出的文字包括:所述云服务器按照分段的编号,将识别出的印刷体文字顺序排列,直到最后一个分段文字。3.根据权利要求1~2任一项所述的文字识别输出方法,其特征在于,该方法还包括:所述手写板终端存储手写输入的文字,各分段扫描图像和云服务器返回的印刷体文字;所述云服务器存储来自手写板终端的分段扫描图像,和分段文字识别后的印刷体文字。4.一种文字识别输出系统,其特征在于,至少包括手写板终端,云服务器,其中,手写板终端,用于接收手写输入,并将输入的文字信息进行分段并分段扫描成图像后发送给云服务器;显示来自云服务器的文字信息;云服务器,用于根据统计识别和结构识别方法,完成对分段扫描图像的文字识别,合并从各分段扫描图像识别出的文字并发送给手写板终端;手写板终端,还用于在所述分段扫描图...

【专利技术属性】
技术研发人员:马书惠张云勇房秉毅
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1