当前位置: 首页 > 专利查询>微软公司专利>正文

手写识别的训练与合成制造技术

技术编号:2924833 阅读:214 留言:0更新日期:2012-04-11 18:40
提供用于将文本转换成自然人手写体的方法与系统。一个方面涉及训练计算机以识别用户的手写体风格。在一个实施例中,计算机接收由用户书写的至少一个字符的手写样本,诸如作为在多个其他字符中开始、中间、或结尾字符提供的字符。另外的实施例考虑到手写体的增强的个性化。另一方面涉及用于显示计算机用户的手写体表示的系统和方法。在一个实施例中,手写体包括字母的变化形状、字母之间的个性化连接风格以及看上去压力敏感的连接部分。在另一个实施例中,字符被调整,诸如切除字符的一些部分以建立手写体的更现实的改造和合成。

【技术实现步骤摘要】
【国外来华专利技术】专利说明手写识别的训练与合成
技术介绍
计算环境的个性化已变得越来越流行。除了具有类似功能的大量软件包供用户选用外,用户可以个性化那些软件包中的设置。例如, (微软视窗)操作系统的用户可以个性化他们的墙纸和声音以及操作系统的其他特征。尽管调节这些特征增强了用户个人体验,但允许用户在计算环境内再造他们自己的手写体可以能是最能将一个用户与他人区别并使其个性化的一种手段。此外,不象某些私人设置,如果用户的电子邮件或其他文档能以个性化手写体来书写,他/她可能会有兴趣分享他/她的手写体。 一般而言,已尝试两类生成或模仿手写体的方法直接手写体捕捉和个人字体设计。直接捕捉收集数字形式的手写体并使用记录的笔划点位置、压力和画笔风格在接收者的计算机上重新构造手写体,或可以简单地将手写体的图象发送给接收者。此方法经常在输入板PC上采用。不幸的是,这要求用户使用数字笔直接在屏幕上书写,使得诸如准备冗长的电子邮件那样需要大量书写的工作可能是不方便且令人厌倦的。 个人字体设计使一组手写体字符归入一系统字体,例如一个真实类型的字体。然而,个人的字体在字符形状不产生手写体应有的变化。此外也无法产生自然的草书手写体,因为在系统字体中的字符仅仅是并排呈现的。 因而,在本领域中存在一个需求,即允许计算机用户容易且有效地训练计算机识别他/她的手写体而不需要那些象是与直接捕捉相关联的时间密集的书写练习。对系统和方法还存在一个需求,就是能够从从手写体样本中捕捉比诸如用个人字体设计系统的单独字符的形状更多的特征。用本专利技术的一个或多个方面可满足那些和其他需求。 专利技术内容 本专利技术的诸方面涉及用于训练计算机识别用户手写体的系统和方法。在一示例中,计算机接收至少一个由用户书写的字符的手写体样本。这些样本可以包括提供作为单词开始字符的字符、提供作为在单词中间的字符、提供作为单词结尾字符的字符。可从样本中提取控制点以表示该字符的形状。在又一示例中,确定字符的垂直和水平对齐。 另一方面涉及用于显示计算机用户的手写体表示的系统和方法。在一示例中,同一字符如上所述的不同变化可根据该字符的特定用途之一而被使用。在另一示例中,方法可以确定在用户输入中接收的至少两个字符是否应被联结,即使这些字符是同一单词或字符串的一部分。在又一示例中,字符被调整,诸如切除字符的一些部分以构成更逼真的改造和合成。在再一示例中,字符在显示前被规格化。在一个这类示例中,规格化调整字符的美学特征。 根据本专利技术的具体示例,生成精确表示手写体的字符,手写体包括字母形状的变化、字母间自然合理且个性化的连接风格,以及看似有压力感觉的连接部分。 这些和其他优点从随后结合附图的详细描述变得显而易见。本专利技术及其优点的更完全的理解可从结合附图参考以下描述获得。在所有附图中相似的标号指类似的特征,且附图如下 附图简述 附图说明图1示出其中可实现本专利技术实施例的示例计算机系统。 图2示出一种用于训练计算机识别用户手写体的方法的功能框图。 图3a和3b示出可用于根据本专利技术的一个实施例接收多个字符样本的示例性用户界面。 图4示出根据本专利技术的一个实施例对一个字符的控制点的示例性提取。 图5示出在连接到单笔划字符的一多笔划字符之间的示例性连结概率。 图6是显示计算机用户的手写体表示的一种示例性方法的流程图。 图7示出按照本专利技术的一方面用概率表合成的一个示例性字符集合。 图8提供根据本专利技术一个实施例的4个示例性字符。 图9示出以一个水平距离彼此连结的示例性字符对。 图10示出按照本专利技术一个实施例表示加权函数的特征的图形。 具体实施例方式 示例性操作环境 图1是可用于结合实现本专利技术的方法和系统使用的常规通用数字计算环境的一个示例的功能框图。在图1中,计算机100包括处理单元110、系统存储器120和将包括系统存储器的各种系统组件耦合到处理单元110的系统总线130。系统总线130可以是几种类型的总线结构中的任何一种,包括存储器总线或存储控制器、外围总线、以及使用各种总线体系结构中的任一种的局部总线。系统存储器120包括只读存储器(ROM)140和随机存取存储器(RAM)150。 基本输入/输出系统160(BIOS)包含如在启动时帮助在计算机100中的元件之间传输信息的基本例程,储存在ROM 140中。计算机100也包括用于对硬盘(未示出)进行读写的硬盘驱动器170、用于对可移动磁盘190进行读写的磁盘驱动器180、以及用于对诸如CD ROM或其它光媒质等可移动光盘192进行读写的光盘驱动器191。硬盘驱动器170、磁盘驱动器180和光盘驱动器191分别由硬盘驱动器接口192、磁盘驱动器接口193和光盘驱动器接口194连接到系统总线130。驱动器及其关联的计算机可读媒质为个人计算机100提供了计算机可读指令、数据结构、程序模块和其它数据的非易失存储。本领域的技术人员可以理解,在示例操作环境中也可使用可储存可由计算机访问的数据的其它类型的计算机可读媒质,如磁带盒、闪存卡、数字视频盘、贝努利盒式磁带、随机存取存储器(RAM)、只读存储器(ROM)等等。 众多程序模块可储存在硬盘170、磁盘190、光盘192、ROM 140或RAM150中,包括操作系统195、一个或多个应用程序196、其它程序模块197和程序数据198。用户可通过输入设备,如键盘101和定位设备102向计算机100输入命令和信息。其它输入设备(未示出)可包括麦克风、操纵杆、游戏垫、圆盘式卫星天线、扫描仪等等。这些和其它输入设备通常通过耦合到系统总线的串行端口接口连接到处理单元110,但也可通过其它接口连接,如并行端口、游戏端口和通用串行总线(USB)。所示的计算机100包括可选的PCMCIA接口103,它可将按照本专利技术的输入设备的至少一个实施例连结到计算机100。监视器107或其它类型的显示设备也通过如视频适配器108的接口连接到系统总线130。一个辅助显示设备199也可以与计算机100通信。该辅助设备可集成在计算机中(如图所示),可与计算机分开或在计算机外部。该辅助显示199能可选地与辅助处理器200通信,后者可集成在辅助显示器中或位于计算机100之中。除监视器之外,个人计算机通常包括其它外围输出设备(未示出),如扬声器或打印机。 计算机100可在使用到一个或多个远程计算机,如远程计算机109的逻辑连接的网络化环境中操作。远程计算机109可以是服务器、路由器、网络PC、对等设备或其它公用网络节点,并通常包括上述涉及计算机100的许多或所有元件,尽管图1中仅示出了存储器存储设备111。图1所描述的逻辑连接包括局域网(LAN)112和广域网(WAN)113。这样的网络环境常见于办公室、企业范围计算机网络、内联网和因特网。 当在LAN网络环境中使用时,计算机100通过网络接口或适配器114连接到局域网112。当在WAN网络环境中使用时,个人计算机100通常包括调制解调器115或其它装置,用于通过广域网113,如因特网建立通信。内置或外接的调制解调器115通过串行端口接口106连接系统总线130。在网络环境中,相对个人计算机100画出的程序模块或其部分可存储在远程存储器存储设备中。 可以理解,所示的网络连接是说本文档来自技高网...

【技术保护点】
一种训练计算机(100)以识别计算机用户的手写体的计算机实现方法,包括下列步骤: (a)接收由所述用户书写的至少一个字符(405)的手写样本,所述样本包括至少一个作为多个其他字符的开始字符提供的字符(405)的样本、至少一个在多个其他字符中间提供的字符(405)的样本、和至少一个作为多个字符的结尾字符提供的字母(405)的样本; (b)从所述诸样本提取多个控制点(410),其中所述控制点表示所述字符(405)的形状; (c)确定所述字符(405)相对于基线(316)的垂直位置包括确定所述字符(405)底部到基线(316)的距离的步骤;以及 (d)规格化至少一个字符(405)的至少一个样本。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:Z林L万CH胡J王
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利