当前位置: 首页 > 专利查询>北京大学专利>正文

一种汉字输入方法和使用该方法的系统技术方案

技术编号:2874076 阅读:178 留言:0更新日期:2012-04-11 18:40
一种对单个汉字进行输入的方法及其输入系统,该系统包括第一输入装置、第二输入装置、语音识别装置、字型识别装置、字库装置、汉字特征处理装置以及显示装置,该方法包括:第一输入装置输入汉字的语音特征,第二输入装置输入同一汉字的N个字型特征;语音识别装置和字型识别装置对分别对语音特征和字型特征进行识别;汉字特征处理装置将同一汉字的语音特征及字型特征结合,从字库中选出既符合所述语音特征也符合所述N个字型特征的一个候选汉字集合,并将其输出显示。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及汉字输入,具体而言,涉及将汉字的语音特征和字型特征结合来输入单个汉字的方法和使用该方法的系统。
技术介绍
随着计算机使用的日益普及,计算机早已不再是单纯的科学计算工具,而是成为了人们日常生活和工作中的辅助工具。因此如何提高人与计算机的交互效率、降低用户的交互负担,成为了一个十分重要的问题。而信息的输入又是这个问题中最为关键的一个方面。在台式机上目前比较流行的汉字输入方法大体可以分成两种,一是使用拼音的方法(如微软输入法),二是使用汉字结构的方法(如五笔字型),他们的输入工具都是键盘。随着人机交互技术的不断发展,新的汉字输入方法不断的涌现,其中手写笔输入和语音输入是目前看来最有前景的输入方法,这是因为手写和语音是人们最自然的交流手段。同时,随着掌上电脑等手持移动设备的大量出现和使用,键盘因体积较大而无法在移动的环境中发挥其作用,这给手写输入和语音输入提供了更大的使用空间。与本专利技术相关的
技术介绍
包括1.语音识别技术语音识别技术以语音信号处理为研究对象,涉及语言学、计算机科学、信号处理、生理学、心理学等诸多领域,是模式识别的重要分支。50年代,是语音识别研究工作的开始时期,其标志贝尔实验室研制成功的可识别十个数字的系统。60年代,计算机广泛应用于语音识别的研究工作中,动态规划和线性预测分析技术是这一时期的重要成果。70年代,语音识别的研究取得了突破性进展,在实际探索中,基于线性预测倒谱和动态时间规整技术的特定人孤立音识别系统被研制成功,在理论方法上,则提出了矢量量化和隐马尔可夫模型理论。80年代,语音识别的研究工作进一步深入。其标志是人工神经元网络在语音识别中的成功应用。90年代,随计算机技术的飞速发展,语音识别从研究走向实用,其研究成果已达到相当高的水平。IBM公司推出的Via Voice语音识别软件是语音识别的一个成功的实例。它是一个支持连续语音输入和非连续语音输入的识别软件,同时还能提供一套语音识别的引擎。但是,目前语音识别也有其不足之处,其中一个比较重要的问题是由于汉字的同音字众多,因此在用户进行单字语音输入的时候,如何在同音字中筛选出想要输入的汉字,是一个需要解决的问题。在IBM的Via Voice软件中,系统将自己默认的使用频率最高的字给出,如果用户要输入的不是这个字,则可以通过特定的操作命令系统将这个字的所有同音字列出,由用户进行二次选择。因此,这种方法的问题是对于一些同音字众多的单字来说,选择过程对用户是一个很大的负担。2.手写汉字识别技术随着模式识别和计算机人工智能的发展,在英文和数字识别的基础上,汉字识别技术于20世纪70年代发展起来,并经历了由印刷体汉字识别到联机手写识别的过程。印刷体汉字识别最早开始于日本,并于1980年对其研制开发的印刷体汉字识别装置进行了公开演示,该装置可识别汉字2000个,识别速度为100字/秒,当时的识别准确率达到98.4%。中国的汉字手写识别开始于上个世纪70年代,开始的研究方向也集中在印刷体的手写识别,在90年代前期取得了印刷体手写识别研究的阶段性成果。随着科学技术的发展和计算机的日益普及,20世纪80年代开始,联机的汉字手写识别受到了越来越多的重视。联机手写的汉字识别是一个实时交互的系统,用户一边通过笔和相应的输入设备进行手写输入,计算机系统一边采集和识别用户的输入,并将识别结果返回给用户。在联机手写识别的研究方面,汉王科技公司取得了非常骄人的成绩,其开发的汉王笔汉字联机手写识别系统可以识别繁体、简体、行书、草书等各种字体。从汉字识别的理论方法上看,汉字识别的方法基本上分为统计识别、结构识别以及神经网络方法等几大类。大量的联机手写识别系统采用的都是结构识别方法。所谓结构识别方法,其出发点是汉字的组成结构,从汉字的构成上讲,汉字是由笔划(点、横、竖、撇、捺等)、偏旁、部首构成,通过把复杂的汉字模式分解为简单的子模式直至基本模式元素、对子模式进行判定以及基于符号运算进行匹配算法运算,达到对复杂模式的识别。结构识别法的优点是区分相似字的能力强,缺点是抗干扰能力差。统计识别方法是将汉字看为一个整体,其所有的特征是从这个整体上经过大量的统计而得到的,然后按照一定准则所确定的决策函数进行分类判决。统计识别的特点是抗干扰性强,缺点是细分能力较弱。手写识别的一般过程包括数据采集、预处理、归一化、特征抽取、特征匹配及输出文字代码几个主要的阶段。数据采集一般是用户利用笔设备通过手写板或触摸屏等输入设备实现,用户在这些设备上书写的笔画以类似于矢量图的形式被存储下来,系统通过对文字图象的抬笔、落笔、笔迹上各像素的空间位置以及笔段之间的时间关系等信息进行预处理和归一化处理后,以一定的规则提取特征信息,之后由识别装置将特征信息与系统内的识别库进行比较与对照,加以识别,最终转化成为计算机所使用的文字代码。大多数的联机手写汉字识别采用的是结构化模式识别的方法。具体的又可以分成两类多级识别方案和单级识别方案。在多级识别方案中,识别程序总是先识别出每个独立的笔划,而后根据笔划之间的位置关系在判别出整个的汉字。在单级识别方案中,系统直接根据输入完成后的整个汉字作为一个整体来进行识别。手写识别目前在一般的普通微机上已经非常的成熟,但是在掌上电脑上的效果却不是十分的理想。这是因为手持移动设备的存储能力和计算能力有限,使得识别库的大小和匹配的速度、准确性都受到了不同程度的影响。3.基于笔顺的汉字输入方法在目前市场上常见的移动电话中,都提供了“结构输入”。其主要思想是用按键代表特定的笔划,在字库中记录了每个汉字的笔顺信息,按键一次相当于输入了一个笔划,系统会将符合笔划顺序的所有汉字显示出来。这种方法要求用户输入的笔划数目比较多,即按键的次数多,这样很容易增加用户输入的疲劳感。4.将语音和手写相结合的汉字输入方法中国专利公告号为1112252的专利,专利技术了一种将语音和手写结合起来的电脑输入工具。该专利技术把在同一操作系统下的手写板笔式输入汉字和语音输入汉字,用轮询方式结合起来,使这两种汉字输入工具不用切换就能互相调用输入汉字。该专利技术提高了电脑汉字输入的自动化程度,并使许多因各种原因无法用键盘作为汉字输入工具的人士,也能用电脑输入汉字。另外,中国专利审定公告号为2198630的专利中,专利技术人专利技术了一种语音与手写双辨识的数位笔,它是在一可配合数位板作手写信号输入的数位笔笔体的适当位置加装可作为语音输入的麦克风,而成为具有双功能(语音输入,手写输入)的数位笔,此新型的数位笔在做手写输入辨识有误时需以语音输入辅助,直接以笔就嘴作语音输入或语音输入有误时直接以手写修正,如此交互修正可得到快速、省空间、方便的双通道辨识组合效果,即它能提高电脑双辨识系统的效率。上述两个专利技术都是将语音和手写结合起来,使得两者达到互补的效果,让人们的输入更加的方便、快捷、自然。但是,在上面的专利技术中,具体到每个汉字的输入而言,仍然是分别利用语音识别或手写识别技术,因此就单个汉字的输入效率而言,没有提高。本专利技术的目的在于,提供一种输入汉字的方法及使用该方法的汉字输入系统,其中,在输入每个单独的汉字时,可以将语音和手写笔划两种信息结合起来,缩小候选字的范围,提高单字的输入速度,从而提高文字整体的输入速度,从而降低用本文档来自技高网...

【技术保护点】
一种在信息设备上输入汉字的方法,所述信息设备包含一输入系统,所述输入系统包括第一输入装置、第二输入装置、语音识别装置、字型识别装置、字库装置、汉字特征处理装置以及显示装置,所述方法包括如下步骤:从第一输入装置输入汉字的语音特征并将其输出 到语音识别装置,和/或第二输入装置输入字型特征并将其输出到字型识别装置上;利用所述语音识别装置和字型识别装置对分别来自第一输入装置的语音特征和来自第二输入装置的字型特征进行识别,并将结果分别输出到汉字特征处理装置上;利用汉字特征处理 装置对分别来自语音识别装置和字型识别装置的输出结果进行处理,根据所述语音特征和/或字型特征从所述字库中选择出一个候选汉字集合,并将其输出到显示装置上;所述字库中的每个在显示装置上显示来自汉字特征处理装置的所述候选汉字集合;其特征在于 ,所述汉字特征处理装置通过所述第一输入装置输入和所述第二输入装置分别输入的并经语音识别装置和字型识别装置识别的同一汉字的语音特征以及字型特征相结合来从所述字库中选择出既符合所述语音特征也符合所述字型特征的一个候选汉字集合。

【技术特征摘要】

【专利技术属性】
技术研发人员:岳玮宁董爱琴王衡汪国平董士海
申请(专利权)人:北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1