借由提交不全字和/或任意给定字的不全笔画的表意语言短语的缩写手写输入的系统和方法技术方案

技术编号:2847972 阅读:408 留言:0更新日期:2012-04-11 18:40
计算机经由用户输入工具接收预期表意语言多字短语的不完整输入。不完整输入在至少以下方面不完整:不完整输入包括预期短语的一个或多个字的不全笔画。计算机接收具有指示预期字在预期短语中的顺序和不完整输入短语中的任何遗漏字的一个或多个分隔符的用户标记。计算机将所接收的用户输入和所述任何遗漏字所表示的不完整输入短语与规定的参考短语词表比较,识别包括按照预期字的指示顺序的不完整输入短语的参考短语。计算机向用户提供所识别的参考短语的人类可读输出。

【技术实现步骤摘要】

本专利技术涉及供用户输入表意语言文本的计算机驱动系统。更特定地,本专利技术涉及用于借由提交不全字和/或任意给定字的不全笔画的表意语言短语的缩写用户输入的计算机驱动系统。相关技术现今数字设备很普及。人们通常使用台式计算机、笔记本电脑、手机、个人数字助理(PDA)和许许多多这样的设备。概括地说,这些设备中的每一种都是计算机的不同实现。在这些设备中,为人类用户提供适度可靠、方便、有利的提交输入给计算机的方法是必需的。为此,工程师们开发出了种类极其繁多的键盘、鼠标、跟踪球、操纵杆、数字化表面、语音识别系统、眼动跟踪系统以及许多其它工具。表意语言的用户输入一直是一个特殊的难题。与英语不同,其将单词分解为具有26个组成字母的字母表,像中文这样的书面语言使用数以千计不同的字。工程师们通过开发出采用许多种不同技术的解决方案开始解决这一难题。一些例子包括基于字的大型键盘、供借助标准键盘和鼠标使用的复杂计算机菜单系统、棒和按钮输入工具、手写数字化转换器以及许多其它工具。对许多人来说,手写数字化转换器是精选的工具,提供了手写输入的便利和自然感觉。可是,由于中文以及其它其中一些字包括不止二十划的表意语言的复杂性,克服已知手写数字化转换器的缓慢速度几乎是不可能的。此外,风格和倾斜度方面的个体差异增加了挑战性,使得计算机和移动式设备中的手写识别易出错,迫使用户书写得更清楚、仔细,进一步降低了输入速度。
技术实现思路
计算机经由用户输入工具接收预期表意语言多字短语(phase)的不完整输入。不完整输入在至少以下方面不完整不完整输入包括预期短语的一个或多个字的不全笔画。计算机接收具有指示预期字在预期短语中的顺序和不完整输入短语中的任何遗漏字的一个或多个分隔符的用户标记。计算机将所接收的用户输入和所述任何遗漏字所表示的不完整输入短语与规定的参考短语词表(vocabulary)比较,识别其中包括按照预期字的指示顺序的不完整输入短语的参考短语。计算机向用户提供所识别的参考短语的人类可读输出。附图简述附图说明图1A为一种表意语言手写输入和处理系统的硬件部件及互连的框图。图1B图解了所存储映射和词表的不同例子。图2为数字数据处理机器的框图。图3示出了示例性信号承载媒体。图4为示例性逻辑电路的立体图。图5为接收和处理不完整表意语言短语的一般操作序列的流程图。图6为包括多个不完整字和多种分隔符的示例性不完整表意语言短语的示意图。图7为显示将预期字序列与短语词表比较并识别匹配参考短语的示例性序列的示意图。图8为显示接收和处理不完整表意语言短语的更特定操作序列的流程图。具体实施例方式通过结合附图考察以下详细描述,本专利技术的特征、目的和优点对本领域的技术人员来说将变得更明显。硬件部件及互连总体结构本公开的一个方面涉及一种表意语言手写输入和处理系统。该系统可以利用各种硬件部件和互连实施,一个例子通过图1A的系统100描述。更特定的,参照图1A,系统100包括显示器102、数据输入工具104、处理器106和存储器108。在一个例子中,显示器102包括一个较小的PDALCD显示器。然而,显示器102可以用不同尺寸或配置的LCD显示器、CRT、等离子体显示器或任何其它用于接收机器可读输入信号并提供人类可读输出的设备实现。在一个例子中,数据输入工具104包括一个PDA手写数字化部件。在这点上,工具104可以包括一个手写数字化表面,如触摸屏;数字化垫;或,实际上任何其它被配置接收借助触笔、钢笔、铅笔、手指等提交的用户手写的数字化表面等。此外,或者作为替代方案,工具104可以包括一个不同的手势输入工具,如鼠标、滚球式触笔、跟踪球、鼠标、指示棒或其它适合在手边应用的工具等。此外,工具104可以包括前述设备的组合。在一个将工具104实现为手写数字化表面的例子中,可以将显示器102和工具104协同定位,使得数字化表面叠置在显示器102上面。在一个例子中,存储器108包括在诸如PDA之类的小型应用中使用的那种类型的微尺寸闪存。不过,存储器108可以用各种硬件实现,该各种硬件如磁性媒体(如磁带或磁盘存储器等)、固件、电非易失性存储器(如ROM或EPROM或闪存PROM或EPROM等)、诸如RAM之类的易失性存储器、光存储器、以及实际上任何用于存储机器可读数据且适于这里所讨论的应用的装置。至于数据结构,存储器108中的部分可以利用链接表、查阅表、关系数据库、或任何其它有用的数据结构实现。如所图解的,存储器108包括某些子部分,即短语词表110、字词表111、字笔画映射112和字语音映射113。系统100可以被配置实现一个或多个表意字集,但为了便于说明,在诸如简化中文之类的单个已安装字集的环境下对系统100进行了描述。然后,对于已安装字集,词表110包含一个表意短语列表。该列表可以从各种已知标准获得或产生、从语料库(corpus)中提取等。词表110可以在制造系统100时设置,或者在安装或启动或重新配置或另外的适当时机下载。词表110可以通过查阅用户以前的输入、因特网、无线网、或其它源自更新,不时地收集新短语。在图1B中,参考标号152a(以及作为替代的参考标号152b)示出了可能存在于词表110中的两个示例性中文短语。152a的两个短语是简化汉字集的例子。152b的两个短语是传统汉字集的例子。在一个简化中文为已安装字集的例子中,则词表110会包括152a的字。与短语词表110类似,字词表111包括已安装字集的公认表意字的列表。在一个简体中文为已安装字集的例子中,则词表111可以包含152a的各个字。可选地,词表110-111之一或两者可以包括关于字或短语使用频率的数据。该数据可以包含在词表110-111中,或者利用到词表110-111中有关字和/或短语的适当链接在任何地方声明。在一个实施方案中,使用频率在一个语言模型(未示出)中被声明,其概括地表明字(和/或短语)相对于其它字(和/或短语)的使用频率或下一次用户打算选择该字(或短语)的几率。频率可以由下面一项确定字在书面文本或交谈中的出现次数;周围句子的文法;字跟随前面一个或多个字出现的情况;系统当前所处的上下文,例如将姓名输入到电话簿应用程序中;字在系统中的重复使用或最近使用情况(用户自己的频率或其它一些文本源的频率);或,前面这些的任意组合。此外,可以根据一个匹配组成部分那时按照输入笔画顺序出现在字中的几率对该字进行优先级排序。在另一个实施方案中,使用频率基于特定用户对字或短语的使用、或字或短语在特定上下文中的使用,该特定上下文如用户正在编写的一条消息或一篇文章。在这个例子中,频繁使用的字或短语成为更合适的字或短语。对词表111中的一些或所有字,字笔画映射112包括字与其组成笔画的列表之间的相互参照。可选地,映射112包括相对于其它笔画的位置信息以及在形状(字体)和顺序方面的替代笔画。而且,映射112可以提供一个给定字的一种或多种笔画顺序。在图1B中,参考标号154示出了示例性汉字及其组成笔画。在这个例子中,154的字列在字词表111中,组成笔画以与该字相关联的方式列在映射112中。在这个例子中,映射112还可以包括一种或多种笔画顺序,规定输入154的笔画的顺序。类似地,映射113包括每个字与语音表示之间的相互参照,本文档来自技高网...

【技术保护点】
具有多个互连导电元件的电路,被配置执行操作来处理表意语言短语的用户输入,所述操作包括:接收用户输入,包括操作:经由用户输入工具接收预期表意语言多字短语的不完整输入,不完整输入在至少以下方面不完整:不完整输入包括预期短语的一个或多个字的不全笔画; 接收具有指示预期字在预期短语中的顺序和不完整输入短语中的任何遗漏字的一个或多个分隔符的用户标记;将由所接收的用户输入和所述任何遗漏字表示的不完整输入短语与规定的参考短语词表比较,识别其中包括按照预期字的指示顺序的不完整输入短语的所有参考短语;向用户提供所识别的参考短语的人类可读输出。

【技术特征摘要】
US 2005-4-25 60/675,0591.具有多个互连导电元件的电路,被配置执行操作来处理表意语言短语的用户输入,所述操作包括接收用户输入,包括操作经由用户输入工具接收预期表意语言多字短语的不完整输入,不完整输入在至少以下方面不完整不完整输入包括预期短语的一个或多个字的不全笔画;接收具有指示预期字在预期短语中的顺序和不完整输入短语中的任何遗漏字的一个或多个分隔符的用户标记;将由所接收的用户输入和所述任何遗漏字表示的不完整输入短语与规定的参考短语词表比较,识别其中包括按照预期字的指示顺序的不完整输入短语的所有参考短语;向用户提供所识别的参考短语的人类可读输出。2.如权利要求1所述的电路,其特征在于,不完整输入还在以下方面不完整不完整输入包括表示预期短语的一些但非所有字的用户输入。3.如权利要求1所述的电路,其特征在于,所述不全笔画包括以下至少一个预期字的零笔画(zero stroke);预期字的一些但非全部笔画。4.如权利要求1所述的电路,其特征在于,接收用户输入的操作包括接收描述一个或多个预期字的语音信息,用户输入不包含任何关于字笔画的输入。5.如权利要求1所述的电路,其特征在于,接收预期表意语言多字短语的不完整输入的操作包括接收表示描述一个或多个预期字的语音信息的用户输入。6.如权利要求5所述的电路,其特征在于,比较操作还包括,针对预期短语的每个预期字,对照参考字与它们的组成语音信息之间的映射检查任何用户输入语音信息,以排除其语音信息与关于那个参考字的用户输入不一致的参考字。7.如权利要求1所述的电路,其特征在于,接收用户输入的操作包括接收描述一个或多个预期字的字笔画输入。8.如权利要求1所述的电路,其特征在于,用户输入被接收为用户提交的序列;其中针对每个提交重复所述比较操作;其中每当所述比较操作的重复修正所识别的参考短语,重复所述提供操作。9.如权利要求1所述的电路,其特征在于,接收具有一个或多个分隔符的用户标记的操作包括接收指示预期短语中字的总数的分隔符。10.如权利要求1所述的电路,其特征在于,比较不完整输入短语的操作还包括将用户输入字笔画的顺序与参考短语中字的规定笔画顺序比较。11.如权利要求1所述的电路,其特征在于,所述操作还包括在提供所识别的参考短语的人类可读输出之前根据规定的使用频率标准定制所识别的参考短语。12.如权利要求1所述的电路,其特征在于,比较操作包括针对预期短语的每个预期字,对照参考字与它们的组成笔画之间的映射检查任何用户输入笔画,以识别可能表示用户输入笔画的完备化的参考字;通过产生所识别的参考字的不同组合制订可能短语的列表,其中每种组合包括按照预期字在预期短语中出现的相同顺序排列的、预期短语的每个预期字的一个所述所识别的参考字;将列表中的每个可能短语与规定的参考短语词表比较,并识别其中包括可能短语的所有参考短语。13.如权利要求12所述的电路,其特征在于,检查操作还包括对照参考字与笔画顺序之间的映射检查用户输入笔画的顺序,以排除不可能表示用户输入笔画的完备化的参考字。14.如权利要求1所述的电路,其特征在于,所述操作还包括促使用户从输出中选择预期短语。15.如权利要求1所述的电路,其特征在于,所述操作还包括根据预定笔画种类将预期表意语言多字短语的不完整输入的笔画分类的操作;其中比较步骤还包括将预期表意语言多字短语的不完整预期输入的笔画种类与规定的参考短语词表的笔画种类比较。16.如权利要求1所述的电路,其特征在于,接收用户输入的操作包括经由用户输入工具接收明显语音或语义意义的字子组成部分的输入;其中比较操作还包括,针对预期短语的每个预期字,排除与预期字的任何用户输入字子组成部分都不一致的参考字。17.具有多个互连导电元件的电路,被配置执行操作来处理表意语言短语的用户输入,所述操作包括接收部分多字表意语言短语的数字化用户手写输入,除(1)缺失一个或多个字的一个或多个笔画、和(2)完全缺失一个或多个字两者中至少一个之外,所述部分多字表意语言短语的数字化用户手写输入形成一个预期多字表意语言短语;接收具有分隔符的用户标记,所述分隔符规定预期多字表意语言短语的字的相对位置;利用分隔符确定所接收的字和所述部分短语中的...

【专利技术属性】
技术研发人员:吴剑超张路赖皇瑜MR朗格
申请(专利权)人:泰吉克通讯股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利