通过多模态基于WEB的界面的用户验证制造技术

技术编号:2834039 阅读:169 留言:0更新日期:2012-04-11 18:40
一种使用基于Web的多模态界面来验证用户身份的方法可以包括:将多模态标记语言文档发送到远程计算设备,所述多模态标记语言文档当由所述远程计算设备呈现时向用户查询用户标识符并使得用户话音被发送到多模态基于Web的应用。所述用户标识符和所述音频可以大约同时从客户端设备接收。所述音频可以与关联于所述用户标识符的话音印迹进行比较。根据从所述比较步骤获得的结果,位于所述远程计算设备的用户可以被选择性地准许对系统的访问。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及使用多模态(multimodal )基于Web的界面验证用户身份。技术背景多模态界面允许用户通过可视和口语方式与应用或其它系统通信。例 如,用户可通过图形用户界面(GUI)进行通信,这可以通过发出一个或 多个口头言词或通过提供GUI输入和话音输入的组合。多模态交互可以向 用户提供与系统通信的更多直觉方式。关于便携式计算设备,诸如智能电话、个人数字助理、以及其它具有 小型表格要素的设备,多模态界面允许用户基于情况选择交互方式。在某 些情形中,使用GUI可能是有利的,而在其它情形中,话音数据输入可能 更有利或更方便。例如,在通常情况下,用户可以选择话音交互,因为这 是直觉性和迅捷的。话音数据输入进一步免除了用户不得不使用微型小键 盘或小型GUI,所述二者在使用上都可能是麻烦并緩慢的。不过,在嘈杂环境中,话音数据输入也许是不可能的。周围的噪声级 可能掩盖用户话音输入,以至于对用户语音的精确识别是不可能的。在其 它情况下,诸如当验证用户身份时,用户也可能选择小键盘输入或非口语 交互。典型地,使用用户名和口令来实施用户验证。因为将这样的信息说 出到多模态界面中可能允许其他人无意听到机密信息,所以用户通常使用 GUI或小键盘输入这样的信息。不过,如所迷,在便携式计算设备上以此 方式输入这样的信息可以M烦并緩慢的。使用口令还有其它缺点.典型地,口令难于记住并且不太安全。考虑 到用户拥有的过多的帐户,其中每个帐户都需要用户名和口令,则记住口令可能是特别困难的。为避免不得不记住每个口令,用户倾向于对于多个帐户使用一个通用口令、将口令写在访问卡(即ATM卡)的背面、或所 使用的口令与用户对于该帐户的用户名相同。这些行为中的任一种都可能 将用户帐户的安全置于危险中。而且,由于诸如银行、航线预订、产品购买等等的功能开始迁移到多 模态基于Web的界面,用户验证将变得越来越重要。这样的系统仅在交易 是安全的并且系统确保该用户是用户所声明的那个人之时才可以是成功 的。因此,提供一种克服了上述缺陷的、通过多模态界面验证用户的技术 将是有利的。
技术实现思路
本专利技术提供了一种在通信网络上验证用户身份的解决方案。本专利技术的 一实施例可以包括一种使用多模态基于Web的界面来验证用户身份的方 法。所述方法可以包括将多模态标记语言文档发送到远程计算设备,所 述多才莫态标记语言文档当由所述远程计算设备呈现时向用户查询用户标识 符并使得用户话音的音频发送到多模态基于Web的应用。所述用户标识符 和记录可以大约同时从客户端设备接收。所述音频可以与关联于所述用户 标识符的话音印迹进行比较。因此,根据从所述比较步骤获得的结果,位 于所述远程计算设备的用户可以被选择性地准许对联机系统的访问。本专利技术的另一实施例可以包括一种用于验证用户身份的系统。所述系 统可以包括具有包括多个话音印迹的话音印迹数据库的验证系统,每个 话音印迹关联于用户标识符。所述系统还可以包括多模态应用,其被配 置发送多模态标记语言文档到客户端设备。所述多模态标记语言文档可以 指定随机脚本,并当执行时使得用户标识符和包括大声读出所述随;f几脚本 的说话者的数字表示的音频净i:iC送回所述多模态应用。所述多模态应用可 以将所述脚本、所述记录和所述用户标识符提交给所述验证系统,用于通 过比较所述记录和从关联于所述用户标识符的多个话音印迹中选择的话音 印迹来验证说话者的身份。本专利技术的其它实施例可以包括机器可读存储装置,其被编程以使得机 器实施这里描述的各种步骤。附图说明现在将仅通过示例并参考附图来描述本专利技术的实施例,在附图中图1是说明了根据这里公开的专利技术方案的使用多模态基于Web的界面 来实施用户-验证的系统的示图;图2是说明了根据这里公开的专利技术方案的出于用户验证目的对用户进 行登记的方法的流程图;以及图3是说明了根据这里公开的专利技术方案的实施用户验证的方法的流程图。具体实施方式以下是对用于通过使用多模态基于Web的界面来验证用户身份的示 例性技术和系统的描述。用户身份可以通过使用话音识别技术来验证。可 以向用户示出从多模态基于Web的应用接收的多模态文档。所述多模态文 档(即网页类型的界面)可以请求用户提供用户标识符或用户名(下文为 用户ID)以及话音样本。用户ID和话音样本可以被提供回多模态基 于Web的应用。可以依据话音样本并参考用户ID实施话音验证。基于话 音验证的结果,用户可以被准许对联机系统的访问或被拒绝进入。图l是说明了根据这里公开的专利技术方案的使用多模态基于Web的界面 来实施用户验证的系统100的示图。如图所示,系统100可包括客户端设 备105、包括多模态应用120的服务器110、以及具有话音印迹数据库130 的验证系统125。在一实施例中,客户端设备105可以是多种计算设备中的任一种,诸 如台式计算机、服务器等等。在另一实施例中,计算设备105可以是便携 式和/或移动计算设备,诸如膝上型计算机、或者有线或者无线的被配置用 于因特网通信的个人数字助理(PDA)、移动电话等等。在任意情形中,客户端设备105可以包括适当的软件,其用于发送请求到服务器110和从 服务器110接收信息。例如,客户端设备105可以包括能够呈现标记语言 文档(包括多模态标记语言(MML)文档)的适当的浏览器。MML文档可以指定用于用户交互的可视和话音组件。因此,MML 文档可包括基于任意标记语言的文档或文件,当其被呈现时允许用户通过 可视方式(诸如图形用户界面(GUI))以及通过可听方式(通过说出或 提供双音多频输入)来提供输入。这样的标记语言的一个示例是X+V标记 语言。X+V是所提出的用于开发多模态网页的标记语言,其结合了可扩展 超文本标记语言(XHTML)和话音可扩展标记语言(VoiceXML)的子集。一般而言,XHTML是已被调整为符合可扩展标记语言(XML)的规 则的HTML 4.0的一版本。VoiceXML是通过万维网协会(W3C)开发的 基于XML的语言。VoiceXML提供用于构造基于语音的应用的标准化格 式。XHTML和VoiceXML (X+V)共同使得Web开发者能够将话音输入 和输出添加到传统的基于图形的网页。MML的另 一示例是基于将语音应用语言标志(SALT)添加到宿主标 记语言,所述宿主标记语言诸如XHTML、超文本标记语言(HTML)或 者可缩放向量图形(SVG) 。 SALT是所提出的可以用于开发支持可视和 语音模式的用户交互的多模态网页的标记语言.SALT是通过SALT论坛 开发的基于XML的语言。服务器110可以是多种能够在通信网络上回复请求并提供信息的信息 处理系统中的任一种,例如Web服务器.如图所示,服务器110和客户端 设备105可以在通信网络115上通信,所述通信网络115诸如因特网、局 域网(LAN)、广域网(WAN)、移动或蜂窝式网络、另外的多种通信网 络、或它们的任意组合。多模态应用120可以在服务器110内执行。因此,多模态应用120可 以从客户端设备105接收请求和信息,并作为回复提供诸如标记语言文档 (多模态的或非多模态的)的信息。尽管未示出,多模态应用120还可以 包括或访问音频处理服务,诸如文本到语音(TTS)、语音识别本文档来自技高网
...

【技术保护点】
一种使用多模态基于Web的界面来验证用户身份的方法,包括:    将多模态标记语言文档发送到远程计算设备,所述多模态标记语言文档当由所述远程计算设备呈现时向用户查询用户标识符和用户话音的音频;    在多模态基于Web的应用接收所述用户标识符和所述音频;    比较所述音频和关联于所述用户标识符的话音印迹;以及    根据从所述比较步骤获得的结果选择性地准许位于所述远程计算设备的用户对联机系统的访问。

【技术特征摘要】
【国外来华专利技术】US 2005-2-22 11/062,7311.一种使用多模态基于Web的界面来验证用户身份的方法,包括将多模态标记语言文档发送到远程计算设备,所述多模态标记语言文档当由所述远程计算设备呈现时向用户查询用户标识符和用户话音的音频;在多模态基于Web的应用接收所述用户标识符和所述音频;比较所述音频和关联于所述用户标识符的话音印迹;以及根据从所述比较步骤获得的结果选择性地准许位于所述远程计算设备的用户对联机系统的访问。2. 根据权利要求l所述的方法,其中所述多模态标记语言文档包括使 所述音频流动的指令,所述方法进一步包括响应于呈现所述多模态标记 语言文档和解释所述使所述音频流动的指令,所述远程计算设备使所述音 频流向所述多模态基于Web的应用。3. 根据权利要求l所述的方法,其中所述多模态标记语言文档包括记 录所述音频的指令,所述方法进一步包括响应于呈现所述多模态标记语 言文档和解释所述记录指令,所述远程计算设备产生对用户话音的数字记录。4. 根据权利要求l所述的方法,其中所述多模态标记语言文档指定将 由用户大声读出的脚本。5. 根据权利要求4所述的方法,其中所述脚本至少部分地包括随机生 成的文本。6. 根据权利要求4所述的方法,其中所述音频是大声读出所述脚本的 用户的数字表示。7. 根据权利要求6所述的方法,所述比较步骤进一步包括所述多模态 基于Web的应用首先将所述音频、所一本和所述用户标识符发送到lHt 系统。8. 根据权利要求l所述的方法,进一步包括 首先将指定登记脚本的多...

【专利技术属性】
技术研发人员:D哈拉米略G麦柯布
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1