用于驱动多个应用的方法和对话管理系统技术方案

技术编号:3045416 阅读:181 留言:0更新日期:2012-04-11 18:40
本发明专利技术描述一种通过公共对话管理系统(1)来驱动多个应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])的方法。其中,将唯一的听觉图标集(S↓[1]、S↓[2]、S↓[3]…、S↓[n])分配给每一应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])。公共对话管理系统(1)通过在对话流的特定点上重放从相应应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])的唯一的听觉图标集(S↓[1]、S↓[2]、S↓[3]…、S↓[n])中选择的相关听觉图标(I↓[1]、I↓[2]、I↓[3]…、I↓[n])而向用户告知应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])的状态。而且本发明专利技术描述了一种对话管理系统(1),其包括:输入检测装置(4),用于检测用户对系统的输入(5);声音输出装置(6),用于输出听得见的声音(7);核心对话引擎(8),用于通过解释用户输入(5)而调整对话流并且合成听得见的声音输出(7);应用接口(10),用于对话管理系统(1)和应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])之间的通信;被分配给应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])的唯一的听觉图标集(S↓[1]、S↓[2]、S↓[3]…、S↓[n])的源;以及听觉图标管理单元(11),用于选择与应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])相对应的相关听觉图标(I↓[1]、I↓[2]、I↓[3]…、I↓[n])以便在对话流中的特定点处重放。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体涉及一种用于通过公共的至少部分基于语音的对话管理系统来驱动多个应用的方法以及用于驱动多个应用的对话管理系统。人机接口领域的近来发展已经导致借助于应用和应用用户之间的对话来管理或驱动的技术设备或应用的广泛使用。大多数对话管理系统是基于可视信息的显示和在用户部分上的手动交互。例如,用户利用个人数字助理而能够进入对话或对话流以便计划约会或读取输入的邮件。通过对话管理系统发布提示来执行该对话,其中用户借助于笔或键盘输入来响应所述提示。用户能够请求所述应用以报告正在出现的或者在不久的将来将出现的事件。例如,个人数字助理能够向用户提示即将到来的约会或重要日子。可以在显示器上图形表示所述提示,并且该提示伴有诸如嘟嘟声、咻咻声或相似的人工声响那样听得见的提示,以便引起用户的注意并且提示他看显示器以便看见应用所传递的消息或提示。可以将同一类型的嘟嘟声或咻咻声用作为一般引起注意的设备,或者可以使用几种不同类型的声音以指示不同类型的事件。在播放术语中,所述的嘟嘟声通常被称为“耳标(earcon)”,即图标的可听到的等价物。只要在用户和唯一一个应用之间执行所述对话,记住哪一个耳标或嘟嘟声与哪一个事件有关并不是特别困难。然而,如果对话管理系统管理用户和多个应用之间的对话,那么由于用于指示不同类型事件的声音通常被限于嘟嘟声和其他人工发生电子噪声,所以会变得相当混乱。用户会被混淆并且将一种类型的声音误认为是另一种,从而曲解该对话流。然而,至少部分的基于语音的对话管理系统允许用户进入一种与应用的单向或双向的口头对话。用户能够发布口头命令并且从对话系统接收可视或听得见的反馈。一种所述的实例是家用电子管理系统,其中用户发布口头命令以激活例如视频记录器那样的设备。另一实例可以是车辆中导航设备或另一设备的操作,其中用户询问设备的问题或者向设备发出命令,其给出响应或反过来提出问题。更先进的对话管理系统能够发布口头提示并且解释口头用户输入。例如如果用户希望检查他的电子邮箱的状态,他可以说“检查我的邮箱”,对话管理系统在转发必要的命令给应用和解释报告回的结果之后会适当地回答“你有邮件”或者“邮箱是空的”。然而,这种口头反馈会使人愤怒,即使其被限制成简洁的短语时也能够激怒人,特别是如果对话管理系统同时驱动多个应用。例如,如果对话管理系统控制个人数字助理、个人计算机、电话、家庭娱乐系统和新闻及天气服务之间的对话,那么以类似于“来自于某某先生的呼叫”、“天气持续晴好”、“拜仁慕尼黑和皇家马德里之间的比赛5分钟后在频道XYZ上开始-我应当记录它吗?”、“在接下来的两周中检查与牙科医生的约会-你想预约吗?”以及“5分钟后与互联网连接超时”等等的语音反馈持续质问用户。用户最终会被正在输出的音量分心,即使该消息是相关的、该信息已经被专门请求的。在Nitin Sawnhey于1998年在Massachusetts Institute ofTechnology所作的理学硕士论文“Contextual Awareness,Messaging andCommunication in Nomadic Audio Environments”中进行了一种尝试,试图提供一种经由作为语音反馈的伴随物的听觉图标而向用户告知应用的状态的对话管理系统。该草案描述了一种能够与远程服务器对接的便携设备。通过通常戴在用户翻领上的便携音频设备而能够报告服务器上激活的一个或多个程序的状态。该设备限于仅从在所述远程服务器上运行的不同程序中接收消息并且监控这些程序的活动(所有相似的属性),从而能够实际上将它们认为是单个应用。但是在该草案中并没有预见通过其中用户既能监控又能控制这些不同应用的公共对话系统进行的多个独立应用的实际驱动,甚至是不同属性的应用的实际驱动。所以,本专利技术的一个目标是提供一种容易、廉价的方法,确保用户进行不同应用之间舒适和简单的区别,其中用户使用公共对话管理系统和不同的应用程序进行交互,该方法尤其确保了用户将不会把预定用于一个应用的命令错误地发布到另一个应用。为此目的,本专利技术提供一种通过公共对话管理系统来驱动多个应用的方法,其中向每一应用分配唯一的听觉图标集,并且其中公共对话管理系统通过在对话流的特定点上听得见的重放从应用唯一的听觉图标集中选择的相关听觉图标而向用户告知该应用的状态。“听觉图标”可以是任意类型的声音或用于描述来自应用的特定类型的反馈的专用声音块,诸如人工短音块(耳标)或者类似于现实声音的声音块,诸如相关声音的录音。根据本专利技术的对话管理系统包括输入检测装置,用于检测用户对系统的输入;声音输出装置,用于输出听得见的提示;核心对话引擎,用于通过解释用户输入和产生输出提示来协调对话流;应用接口,用于对话管理系统和应用之间的通信;被分配给应用的唯一的听觉图标集的源;以及听觉图标管理单元,用于从与应用相对应的唯一的听觉图标集中选择在对话流中的特定点处用于重放的相关听觉图标。使用根据本专利技术的对话管理系统来驱动多个应用,用户能够很容易地区分来自于不同应用的不同类型的反馈。由于应用所报告回的每一类型的反馈伴有唯一意义的听觉声音,用户很容易将其与相应的应用相关联,所以用户没有被混淆的危险,并且将不会把一种类型的反馈与另一种类型的反馈弄错。唯一的听觉图标使用户总是知晓有关他当前正在交互的应用的信息。这确保了用户不会把预定用于一个应用的命令错误地发布到另一个应用。因此,本专利技术特别有利于专门的语音控制的对话管理系统;或者特别有利于这样一种应用,其中对于用户而言,必须看屏幕以跟踪对话是行不通的或者危险的,所述系统诸如是用户不能转移对交通的注意力的自动导航系统,或外科医生在总是知晓该手术过程状态的同时必须保持集中精力于正在进行的手术过程的计算机辅助外科手术过程。因此,本专利技术允许通过公共对话系统来驱动甚至不同属性的多个独立的应用以及允许用户监控和控制该应用。从属权利要求特别公开了本专利技术的优选实施例和特征,借助于此,根据方法权利要求的特征而能够进一步开发该系统。可以将根据本专利技术的对话管理系统结合到已存在的设备中,诸如PC、电视、录像机等等,并且将家庭和/或办公室环境中运行的各种应用的状态告知用户。在优选的实施例中,将对话管理系统实施为具有诸如机器人或优选为人的物理形态的独立设备。可以将对话系统实现为例如DE10249060A1所述的以如下方式构造的专用设备具有示意性面部特征的可移动部分能够面向用户,给出该设备正倾听用户的印象。甚至可以以如下方式构建对话管理系统当用户从一个房间到另一房间时,其能够伴随着用户。可以借助于电缆来实现对话管理系统和个别应用之间的接口。优选的是,以无线方式来实现该接口,诸如红外线、蓝牙等等,这样对话管理系统基本上保持可移动,并且并非限制于定位在其用于驱动的应用附近。如果无线接口足够的可达到范围(reach),那么能够很容易地使用对话管理系统来为位于建筑物中不同房间的设备控制多个应用,所述建筑诸如办公大楼或私人住宅。优选地在专用应用接口单元中管理对话管理系统和个别应用之间的接口。在此,通过将根据口头用户输入而解释的任何命令或指令转发到每一应用并且通过从应用接收预定用于用户的反馈来管理应用和对话管理系统之间的通信。应用接口单元能够以并行的方式处本文档来自技高网...

【技术保护点】
一种通过公共对话管理系统(1)来驱动多个应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])的方法,其中将唯一的听觉图标集(S↓[1]、S↓[2]、S↓[3]…、S↓[n])分配给每一应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n]),并且其中公共对话管理系统(1)通过在对话流的特定点上重放从相应应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])的唯一的听觉图标集(S↓[1]、S↓[2]、S↓[3]…、S↓[n])中选择的相关听觉图标(I↓[1]、I↓[2]、I↓[3]…、I↓[n])而向用户告知应用(A↓[1]、A↓[2]、A↓[3]…、A↓[n])的状态。

【技术特征摘要】
【国外来华专利技术】EP 2004-3-29 04101295.61.一种通过公共对话管理系统(1)来驱动多个应用(A1、A2、A3…、An)的方法,其中将唯一的听觉图标集(S1、S2、S3…、Sn)分配给每一应用(A1、A2、A3…、An),并且其中公共对话管理系统(1)通过在对话流的特定点上重放从相应应用(A1、A2、A3…、An)的唯一的听觉图标集(S1、S2、S3…、Sn)中选择的相关听觉图标(I1、I2、I3…、In)而向用户告知应用(A1、A2、A3…、An)的状态。2.根据权利要求1的方法,其中,重放应用(A1、A2、A3…、An)的听觉图标(I1、I2、I3…、In)以向用户指示应用(A1、A2、A3…、An)的操作状态的改变。3.根据权利要求1或2的方法,其中,应用(A1、A2、A3…、An)将听觉图标集(S1、S2、S3…、Sn)以及涉及其使用的相关指令提交到对话管理系统(1)。4.根据权利要求3的方法,其中,对话管理系统(1)获得应用(A1、A2、A3…、An)的个别听觉图标(I1、I2、I3…、In)的识别信息和相关指令,并且一旦请求,对话管理系统(1)从应用(A1、A2、A3…、An)中检索该听觉图标(I1、I2、I3…、In)。5.根据权利要求3的方法,其中,在用户和应用(A1、A2、A3…、An)之间的对话流一开始或者一旦激活或安装应用(A1、A2、A3…、An),对话管理系统(1)就获取应用(A1、A2、A3…、An)的完整的听觉图标集(S1、S2、S3…、Sn)。6.根据先前任一权利要求的方法,其中,对话管理系统(1)通过修改应用(A1、A2、A3…、An)的听觉图标集(S1、S2、S3…、Sn)中非唯一的听觉图标(I1、I2、I3…、In)和/或从听觉图标的集合(13)中选择用于应用(A1、A2、A3…、An)的唯一听觉图标(I1、I2、I3…、In)而向应用(A1、A2、A3…、An)提供唯一的听觉图标集(S1、S2、S3…、Sn)。7.根据先前任一权利要求的方法,其中,用户和应用(A1、A2、...

【专利技术属性】
技术研发人员:T波尔特勒B施特里夫克尔克J特弗鲁格特
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利