用于在设备上进行数据输入的方法和系统技术方案

技术编号:2883412 阅读:217 留言:0更新日期:2012-04-11 18:40
提供一种在设备上输入数据的技术。一开始,在设备上接收语音数据。将语音数据和设备标识符传送到计算机。在计算机上将语音数据翻译成文本。然后确定是否要过滤翻译文本。如果确定要过滤翻译文本,就对翻译文本应用一个过滤器。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般地说涉及计算机实现的系统,更具体来说,涉及向诸如个人数字助理(PDA)的处理能力有限的设备提供作为替代输入设备的连续语音识别。个人数字助理(PDA)是一种将计算与诸如电话和/或网络连接的其它特征功能综合在一起的手持式设备。许多PDA被用作个人记事本(organizer),包含日程表、电子邮件系统和字处理器。向PDA的输入通常是通过手写笔(stylus)而不是通过键盘或鼠标进行的。手写笔是一种“像钢笔一样的”物体,用来在诸如数字书写板(digitaltablet)的屏幕上写数据。手写笔有用来触及数字书写板的电子头,数字书写板含有的电子电路使其能检测手写笔的移动并将这些移动转换成用于计算机的数字信号。有些PDA合有使用户能用手写笔在屏幕上“手写”数据的手写识别功能。然而,一般的手写识别系统有时错误解释手写的数据而要求用户仔细检查和修正手写的数据。PDA已经变得非常流行,正越来越多地被各种人广泛使用。遗憾的是,这些小设备只有有限的存储器容量,较小的显示器,和较慢的运行速度。此外,由于用手写笔来输入数据,使有些残疾人不能使用PDA。因此,在该领域中需要有向具有有限资源的设备输入数据的改进技术。为了克服以上所述的现有技术中的缺陷,克服在阅读和理解本说明书时将逐渐明了的其它缺陷,本专利技术公开一种用于向诸如个人数字助理(PDA)的处理能力有限的设备提供作为替代输入设备的连续语音识别的技术的方法、装置和产品。按照本专利技术一个实施例,提供一项在设备上输入数据的技术。一开始,在设备上接收语音数据。将语音数据和设备标识符传送到计算机。在计算机上,将语音数据翻译成文本。然后确定是否要过滤翻译文本。如果确定翻译文本要过滤,就对翻译文本应用过滤器(filter)。现在参看以下附图-其中相同的标注号自始至终代表相应的部件附图说明图1是表示本专利技术一个实施例的硬件环境的示意图;图2是表示本专利技术一个实施例中的CSC系统212及其环境的示意图;图3是表示由本专利技术一个实施例中的CSC系统212执行的过程的流程图。在以下对本专利技术实施例的说明中,参照构成其一部分的附图,说明书是以能实现本专利技术的特定实施例的方式说明的。应当理解,可以采用其它实施例,因为在不偏离本专利技术范围的情况下可以进行结构上的修改。图1是表示本专利技术一个实施例的硬件环境的示意图,更具体来说,该图表示一个典型的分布式计算机系统,它用网络100把语音数据输入设备102(客户机)与执行计算机程序的服务器计算机104连接,并把服务器系统104与数据源106连接。数据源106可以存储例如包括语音印迹(voice print)记录的用户个人简档(profile)。典型的资源组合可包括语音数据输入设备102-例如是个人电脑或工作站、电话或移动电话、或个人数字助理(PDA)。服务器计算机104例如可以是个人电脑、工作站、小型计算机或大型机。这些系统是由LAN、WAN、SNA网及因特网在内的各种网络连接的。有些语音数据输入设备102(例如个人电脑或个人数字助理)和服务器计算机104另外还包含一个操作系统和一个或多个计算机程序。服务器软件包括一个连续语音识别(CSR)系统110,它包含一个或多个计算机程序用于将语音翻译成文本、过滤文本以及将文本转换成适当格式。服务器计算机104也用数据源接口和可能的其它计算机程序来连接到数据源106。语音数据输入设备102通过线路或无线系统与服务器计算机104双向连接。服务器计算机104进而与数据源106双向连接。操作系统和计算机程序是由指令组成的,这些指令在被语音数据输入设备102和服务器计算机104读取并执行时,使设备和计算机执行实现和/或使用本专利技术所需的步骤。一般地说,操作系统和计算机程序被安装在和/或可读自诸如存储器的设备、载体或介质,其它数据存储设备和/或数据通信设备。在操作系统的控制下,可以将计算机程序从存储器、其它数据存储设备和/或数据通信设备装入计算机的存储器,供在实际运行期间使用。所以,可以用生产软件、固件、硬件及其任意组合的标准程序设计和/或工程技术,把本专利技术实现为方法、装置或产品。本文中所使用的术语“产品”(或者“计算机程序产品”)的意思包括能从任何计算机可读设备、载体或介质获得的计算机程序。当然,本领域的技术人员知道,在不偏离本专利技术范围的条件下可以对这个结构作出许多修改。本领域的技术人员将认识到,图1中所示的示意性环境并非是要限定本专利技术。实际上,本领域的技术人员将认识到,在不偏离本专利技术范围的条件下,可以采用其它替代性的硬件环境。连续语音识别系统在一个实施例中,本专利技术提供一个连续语音识别(CSR)系统。该CSR系统使具有有限处理能力的设备能进行连续语音识别。就是说,大多数手持式设备(例如PDA或移动电话)不具有进行连续语音识别的处理能力。这一点加上它们体积小,用户只好用手写笔在输入区上点触,这使得这些设备极其难以为残疾人所用。这也妨碍使用者快速记录笔记、更新日程表或发送电子邮件。用CSR系统,向设备输入数据变得像说话一样简单。可以设想CSR系统能消除对点触输入设备的需要。CSR系统也便于将体积小得不能有输入板或屏幕的设备(如手腕佩戴设备)用作输入设备。图2是表示本专利技术一个实施例中的CSC系统212及其环境的示意图。CSC系统212位于语音识别服务器210。CSC系统212在一个或多个客户设备(有限处理能力的设备)与一个或多个语音识别服务器之间建立一种共生的关系。为方便解释,图中描绘了一个客户设备200和一个语音识别服务器210。客户设备200能记录和/或中继语音。CSC系统212包含语音-文本翻译软件214和文本过滤和转换软件216。一般地说,客户设备200捕获语音并将其发送到语音识别服务器210供翻译和转换。语音识别服务器210将转换过的信息发送回客户设备200,后者然后将其结合到目标应用程序(例如日程表、电子邮件或笔记本)中。在使用CSC系统212之前,用户向语音识别服务器210提交信息。该信息包含一个在数据储存库中存储的用户个人简档218。用户个人简档包含一个与用户说话方式相关联的“语音印迹”,关于一个或多个要接收数据的目标应用程序的信息,一个或多个标识用户所用的特定设备的客户设备(单元)标识符(ID),和包括电子邮件地址在内的用户联系信息。一开始,用户录制在语音识别服务器上作为语音印迹存储的语音。例如,可以要求每个用户说出特定的文字,诸如一本书中的某段落。所说出的文字就是语音印迹。每个用户说话的方式都有些不同,在停顿和重音上都略有差异。所以,可以用语音印迹来标识用户。此外,语音印迹也被CSR系统212用来更好地将语音转换成文本。用户个人简档被存储在语音识别服务器210后,用户就能通过向位于客户设备200的语音录音/中继机说话而向客户设备200输入语音数据。用户说关键词和其它语句。关键词向CSR系统212指出紧接着的信息的特定类型。关键词的例子包括-但不限于-下列日程表项(CALENDAR ENTRY)、日期(DATE)、时间(TIME)、发送记事(SEND NOTE)、地址项(ADDRESS ENTRY)、记事本项(NOTEPAD ENTRY。要在日程表应用程序中安排会议时间,用户可以向客户设备200说出下列本文档来自技高网...

【技术保护点】
一种在设备上进行数据输入的方法,包含:在设备上接收语音数据;将语音数据和设备标识符传送到计算机;并在计算机上将语音数据翻译成文本;确定是否要过滤翻译文本;和如果确定翻译文本要被过滤,就对翻译文本应用一个过滤器。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:JL基西GJ威尔莫特
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利