一种任务处理方法和设备技术

技术编号:21115271 阅读:22 留言:0更新日期:2019-05-16 08:51
本申请提供了一种任务处理方法和设备,其中,该方法包括:向目标对象发起多媒体问询;获取响应于所述多媒体问询的回复数据;迭代发起问询,直至获得执行预定任务所需数据;基于所述所需数据,发起所述预定任务。通过上述方案可以解决现有的需要用户主动发起语音交互而导致的用户体验不高的技术问题,达到了有效提高用户体验的技术效果。

A Task Processing Method and Equipment

【技术实现步骤摘要】
一种任务处理方法和设备
本申请属于人机交互
,尤其涉及一种任务处理方法和设备。
技术介绍
随着语音识别技术的不断发展,越来越多的语音智能设备被研发和使用。目前语音交互方式一般都还是采用一问一答的方式,一般都是用户发起交流内容。例如,用户问了一句:今天什么天气,语音智能设备回答:今天天气多云,18到26℃。即,需要用户主动触发进行语音交互。也就是需要人作为主导来进行语音交互。然而,需要用户自己触发和引导以使用某个设备的方式,往往用户体验不高。尤其对于有些用户使用频率不高,没有足够时间学习的设备,如果用户进行引导的话,实现起来较为麻烦,且体验不高。针对上述问题,目前尚未提出有效的解决方案。
技术实现思路
本申请目的在于提供一种任务处理方法和设备,可以实现不需要对设备进行引导,设备可以主动发起问询的目的。本申请提供一种任务处理方法和设备是这样实现的:一种任务处理方法,所述方法包括:向目标对象发起多媒体问询;获取响应于所述多媒体问询的回复数据;迭代发起问询,直至获得执行预定任务所需数据;基于所述所需数据,发起所述预定任务。一种任务处理设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现:向目标对象发起多媒体问询;获取响应于所述多媒体问询的回复数据;迭代发起问询,直至获得执行预定任务所需数据;基于所述所需数据,发起所述预定任务。一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述方法的步骤。本申请提供的任务处理方法和设备,设备主动发起问询,并迭代发问,直至获取执行预定任务所需的必要数据,从而提供了一种主动的任务处理方式。通过上述方式可以解决现有的需要用户主动唤醒或者主动发起交互而导致的用户体验不高的技术问题,达到了有效提高用户体验的技术效果。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是根据本申请实施例的人机交互系统的架构示意图;图2是根据本申请实施例的人机交互场景的逻辑实现示意图;图3是根据本申请实施例的预设的位置区域示意图;图4是根据本申请实施例的智能咖啡售卖机的工作场景图;图5是根据本申请实施例的智能咖啡售卖机的另一工作场景图;图6是根据本申请实施例的由设备主动触发人机交互的流程图;图7是根据本申请实施例的设备主动触发人机交互的咖啡购买流程问询示意图;图8是根据本申请实施例的任务处理方法的方法流程图;图9是根据本申请实施例的终端设备的结构示意图;图10是根据本申请实施例的任务处理装置的结构框图;图11是根据本申请实施例的集中部署方式的架构示意图;图12是根据本申请实施例的大集中小双活的部署方式的架构示意图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。考虑到现有的与智能语音设备进行语音交互的时候,一般都是用户主动触发进行语音交互。例如,用户到柜台买咖啡,假设柜台设置了一个自动售卖机,一般需要用户主动交互,用户说:我想要一杯卡布奇诺,设备回答:好的,一杯卡布奇诺。即,需要用户进行触发。这样在很多场合,这种需要用户主动触发的方式,很显然给用户的用户体验不高。尤其是在服务行业,相对而言设备主动发起对话的方式,用户体验感更好。例如,同样是上述用户到柜台买咖啡的例子。如果是自动售卖机主动发起对话,比如,设备说:您好,请问想要什么咖啡?设备回答:一杯卡布奇诺。这种交流方式,可以有效提高用户体验,自动贩卖机的智能性可以得到有效提升。又例如,用户到售卖地铁票的设备前打算购买地铁票,如果是用户主动触发购买流程往往不知道如何开始,尤其对于第一次使用这种设备的用户而言,不知道如何触发,或者如何发问等等。基于此,考虑到可以提供一种任务处理方式,由设备发起对话,这种方式还可以避免用户不知道怎么向设备发问的问题,即,由设备发起的主动的交互方式,在主动交互的方式下,可以由设备向用户进行提问,由设备主导整个对话过程,从而可以降低使用难度。如图1所示,在本例中提供了一种人机交互系统,包括:一个或多个交互设备101、一个或多个用户102。上述交互设备可以是例如:智能音箱、聊天机器人、带有服务提供功能的机器人、或者是手机或者电脑等智能设备中安装的应用程序等等,具体以何种形式存在,本申请对此不作具体限定。如图2所示为基于图1的语音交互系统下进行语音交互的业务逻辑实现示意图,可以包括:1)硬件方面,可以包括:摄像头和麦克风阵列。其中,摄像头和麦克风阵列可以设置在如图1所示的语音设备101中,通过摄像头可以获取人像信息,基于获取的人像信息可以进一步确定出嘴所在的位置,从而可以确定出声音的来源位置,即,通过人像信息可以具体确定出发出声音的嘴的位置,这样也就确定了哪个方向过来的声音是需要获取的声音。在确定出哪个方向的声音是需要获取的声音之后,就可以通过麦克风阵列进行定向消噪,即,可以通过麦克风阵列对声源方向的声音进行加强,对非声源方向的噪声进行抑制。即,通过摄像头+麦克风阵列进行配合的方式,可以实现对声音的定向消噪。2)本地算法,可以包括基于人脸识别的算法和基于信号处理的算法。其中,基于人脸识别的算法可以用于确定出用户身份,可以用于识别用户五官的位置,识别用户是否面向设备,以及用户支付认证等等,都可以通过摄像头配合本地的人脸识别算法实现。其中,信号处理算法可以是在确定出声源位置之后,确定出声源的角度,进而对麦克风阵列的声音拾取进行控制,以便实现定向消噪。同时还可以对获取到的语音进行一定的放大、滤波等处理。3)云端处理,即,在云端实现,也可以是本地实现,这可以根据设备自身的处理能力以及使用环境等确定。当然在云端实现的话,借助大数据对算法模型进行更新和调整,可以有效提升语音识别、自然语音理解和对话管理的准确性。云端处理主要可以包括:语音识别、自然语言理解、对话管理等等。其中,语音识别主要是识别出获取到的语音的内容,例如,获取了一段语音数据,需要理解其含义,那么需要先知道这段语音具体的文字内容,这个过程就需要借助语音识别将语音转换为文字。对于机器而言,文字还是文字本身,需要确定出文字所表达的含义,那么就需要通过自然语言解释来确定出文字对应的自然含义,这样才能识别出用户语音内容的意图以及所携带的信息。因为是人机交互流程,就涉及到问答的环节,可以通过对话管理单元,即,可以设备主动触发问答,以及基于用户的回复继续生成先的问答。这些问答需要预先设置好问题和所需的答案。例如,购买地铁票的对话中,就需要设置:请问您需要到哪一站的地铁票,几张等等这些问答内容,相应的用户所需要提供的是:站名和张数。对于在对话过程中出现的,用户需要更改站名,或者对已经回复的答复进行修改等等,对话管理都需要提供相应的处理逻辑。本文档来自技高网
...

【技术保护点】
1.一种任务处理方法,其特征在于,所述方法包括:向目标对象发起多媒体问询;获取响应于所述多媒体问询的回复数据;迭代发起问询,直至获得执行预定任务所需数据;基于所述所需数据,发起所述预定任务。

【技术特征摘要】
1.一种任务处理方法,其特征在于,所述方法包括:向目标对象发起多媒体问询;获取响应于所述多媒体问询的回复数据;迭代发起问询,直至获得执行预定任务所需数据;基于所述所需数据,发起所述预定任务。2.根据权利要求1所述的方法,其特征在于,迭代发起问询,直至获得预定任务所需数据,包括:获取回复数据;确定回复数据中是否携带有执行预定任务所有必要数据;在确定未携带有所有必要数据的情况下,确定空缺的数据项;基于确定的空缺的数据项向所述目标对象发起多媒体问询,直至获得执行预定任务所需数据。3.根据权利要求1所述的方法,其特征在于,向目标对象发起多媒体问询,包括:确定所述目标对象的身份信息;发起与所述身份信息对应的多媒体问询。4.根据权利要求3所述的方法,其特征在于,所述身份信息包括以下至少之一:年龄、性别。5.根据权利要求3所述的方法,其特征在于,确定所述目标对象的身份信息,包括:通过获取所述目标对象的图像数据和/或声音数据,确定所述目标对象的身份信息。6.根据权利要求1所述的方法,其特征在于,向目标对象发起语音问询,包括:检测在设备的预设位置区域内是否有目标对象;在确定有目标对象的情况下,确定所述目标对象是否面向所述设备,且停留时长超出预设时长;在确定所述目标对象面向设备且停留时长超出所述预设时长的情况下,向所述目标对象发起多媒体问询。7.根据权利要求6所述的方法,其特征在于,检测在设备的预设位置区域内是否有目标对象,包括:通过以下方式至少之一检测在设备的预设位置区域内是否有目标对象:人体感应传感器、红外识别器、地面压力传感器。8.根据权利要求1所述的方法,其特征在于,向目标对象发起多媒体问询,包括:确定是否存储有问答对;在确定存储有问答对的情况下,基于所述问答对,向所述目标对象发起多媒体问询。9.根据权利要求8所述的方法,其特征在于,所述问答对包括对应于执行所述预定任务所需的必要信息。10.根据权利要求1所述的方法,其特征在于,向目标对象发起多媒体问询,包括:获取目标对象的历史行为数据;根据所述历史行为数据生成对应于所述目标对象的多媒体问询。11.根据权利要求1所述的方法,其特征在于,所述多媒体问询包括以下至少之一:文字问询、语音问询、图像问询、视频问询。12.一种任务处理设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指...

【专利技术属性】
技术研发人员:吴楠
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1