一种用于提供语音响应信息的方法与设备技术

技术编号:18446908 阅读:30 留言:0更新日期:2018-07-14 11:11
本发明专利技术的目的是提供一种用于提供语音响应信息的方法与设备。具体地,获取用户输入的自然语言命令,以及所述用户输入所述自然语言命令时所伴随的背景音;根据所述背景音,确定对应的场景信息;根据所述自然语言命令与所述场景信息,确定对应的语音响应信息;将所述语音响应信息提供给所述用户。与现有技术相比,本发明专利技术不仅实现了语音响应信息提供的实时性和精准度,相应地,也提高了用户的信息获取效率,并提升了用户的语音交互体验。

【技术实现步骤摘要】
一种用于提供语音响应信息的方法与设备
本专利技术涉及语音交互
,尤其涉及一种用于提供语音响应信息的技术。
技术介绍
语音识别技术简单来说就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术,其已在家电、汽车电子、消费电子产品等领域斩露头角,极大便利了人们与设备的交互。现有的语音识别技术在语音识别过程中背景音通常作为噪声被过滤掉,未被利用。然而,用户在不同背景音所体现的场景下的需求是不同的,如用户在车载场景下说“去**怎么走”,用户要么需要在现有技术提供的响应结果中进行驾车线路、公交线路、骑行线路、步行线路等类别的选择,要么获得的驾车线路并不是合适的线路,需要用户重新选择,这增加了用户的交互成本,降低了信息获取效率,影响了用户的语音交互体验。
技术实现思路
本专利技术的一个目的是提供一种用于提供语音响应信息的方法与设备。根据本专利技术的一个实施例,提供了一种用于提供语音响应信息的方法,其中,该方法包括以下步骤:a获取用户输入的自然语言命令,以及所述用户输入所述自然语言命令时所伴随的背景音;b根据所述背景音,确定对应的场景信息;c根据所述自然语言命令与所述场景信息,确定对应的语音响应信息;d将所述语音响应信息提供给所述用户。根据本专利技术的另一个实施例,还提供了一种用于提供语音响应信息的提供设备,其中,该提供设备包括:获取装置,用于获取用户输入的自然语言命令,以及所述用户输入所述自然语言命令时所伴随的背景音;第一确定装置,用于根据所述背景音,确定对应的场景信息;第二确定装置,用于根据所述自然语言命令与所述场景信息,确定对应的语音响应信息;提供装置,用于将所述语音响应信息提供给所述用户。根据本专利技术的又一实施例,还提供了一种计算设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如前述根据本专利技术一个实施例的一种用于提供语音响应信息的方法。根据本专利技术的又一个实施例,还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如前述根据本专利技术一个实施例的一种用于提供语音响应信息的方法。与现有技术相比,本专利技术的一个实施例通过获取用户输入的自然语言命令,以及所述用户输入所述自然语言命令时所伴随的背景音,并根据所述背景音,确定对应的场景信息,然后根据所述自然语言命令与所述场景信息,确定对应的语音响应信息,接着将所述语音响应信息提供给所述用户,不仅实现了语音响应信息提供的实时性和精准度,相应地,也提高了用户的信息获取效率,并提升了用户的语音交互体验。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1示出根据本专利技术一个方面的一种用于提供语音响应信息的提供设备的设备示意图;图2示出本专利技术一个实施例的语音响应信息的提供示意图;图3示出本专利技术一个实施例的一种用于提供语音响应信息的提供设备的设备示意图;图4示出根据本专利技术另一个方面的一种用于提供语音响应信息的方法流程图;图5示出本专利技术一个实施例的一种用于提供语音响应信息的方法流程图;图6示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器的框图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本专利技术作进一步详细描述。图1示出根据本专利技术一个方面的一种用于提供语音响应信息的提供设备1,其中,提供设备1包括获取装置11、第一确定装置12、第二确定装置13和提供装置14。具体地,获取装置11获取用户输入的自然语言命令,以及所述用户输入所述自然语言命令时所伴随的背景音;第一确定装置12根据所述背景音,确定对应的场景信息;第二确定装置13根据所述自然语言命令与所述场景信息,确定对应的语音响应信息;提供装置14将所述语音响应信息提供给所述用户。在此,提供设备1是指一种能够根据用户输入的自然语言命令与基于用户输入所述自然语言命令时所伴随的背景音所确定的场景信息,确定对应的语音响应信息,并能够将其提供给用户的设备。在具体实施例中,提供设备1可由智能终端实现,也可由网络设备与智能终端通过网络相集成所构成的设备(即由智能终端和网络设备相配合)实现,还可以作为软件模块和/或硬件模块被包含于智能终端中,也可以作为硬件设备与智能终端通过有线或无线的方式连接。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此,云由基于云计算(CloudComputing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述智能终端可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如PC、手机、智能手机、PDA、可穿戴设备、掌上电脑PPC、可穿戴设备、平板电脑、智能车机、智能电视、智能音箱等。在实际应用中,提供设备1为智能终端时,其上可搭载/安装能够理解、处理并响应用户的自然语言命令并将响应结果进行输出的客户端(可以是APP形式),也可以是该客户端仅能对用户输入的自然语言命令进行语音识别但需对应的服务器来对该自然语言命令进行理解、处理并响应用户的自然语言命令并将响应结果返回客户端进行输出。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(AdHoc网络)等。本领域技术人员应能理解上述提供设备1仅为举例,其他现有的或今后可能出现的网络设备或智能终端如可适用于本专利技术,也应包含在本专利技术保护范围以内,并在此以引用方式包含于此。在此,网络设备及智能终端均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。在一个实施例中,若提供设备1为用户的智能终端,则提供设备1首先通过其自身所提供的应用程序接口(API),或者通过拾音设备所提供的应用程序接口(API),获取用户输入的自然语言命令,以及用户输入所述自然语言命令时所伴随的背景音;然后,提供设备1根据所述背景音确定对应的场景信息;接着,提供设备1根据所述自然语言命令与所述场景信息,确定对应的语音响应信息,并将所述语音响应信息提供给所述用户。在另一个实施例中,若提供设备1为网络设备和智能终端相集成的设备,即提供设备1由智能终端和网络设备相配合实现,则智能终端首先通过其自身所提供的应用程序接口(API),或者通过拾音设备所提供的应用程序接口(API),获取用户输入的自然语言命令,以及用户输入所述自然语言命令时所伴随的背景音;然后,智能终端将所述自然语言命令和所述背景音发送至网络设备,由网络设备先根据所述背景音确定对应的场景信息;接着,网络设备根据所述自然语言命令与所述场景信息,确定对应的语音响应信息,并将所述语音响应信息发送至智能终端,由智能终端将所述语音响应信息提供给所述用户。在还一个实施例中,若提供设备1为网络设备和智能终端相集成的设备,即提供设备1由智能终端和网络设备相配合实现,则智能终端首先通过其自身所提供的应用程本文档来自技高网...

【技术保护点】
1.一种用于提供语音响应信息的方法,其中,该方法包括以下步骤:a获取用户输入的自然语言命令,以及所述用户输入所述自然语言命令时所伴随的背景音;b根据所述背景音,确定对应的场景信息;c根据所述自然语言命令与所述场景信息,确定对应的语音响应信息;d将所述语音响应信息提供给所述用户。

【技术特征摘要】
1.一种用于提供语音响应信息的方法,其中,该方法包括以下步骤:a获取用户输入的自然语言命令,以及所述用户输入所述自然语言命令时所伴随的背景音;b根据所述背景音,确定对应的场景信息;c根据所述自然语言命令与所述场景信息,确定对应的语音响应信息;d将所述语音响应信息提供给所述用户。2.根据权利要求1所述的方法,其中,所述步骤c包括:-根据所述自然语言命令与所述场景信息,确定所述语音响应信息,其中,所述语音响应信息的内容与所述自然语言命令的语义信息,以及所述场景信息适配。3.根据权利要求1或2所述的方法,其中,所述步骤c包括:-根据所述自然语言命令与所述场景信息,确定所述语音响应信息,其中,所述语音响应信息的内容与所述自然语言命令的语义信息、所述自然语言命令所对应的语音特征信息,以及所述场景信息适配。4.根据权利要求1至3中任一项所述的方法,其中,该方法还包括步骤:-根据所述场景信息,确定所述语音响应信息的呈现类型;其中,所述步骤d包括:-根据所述呈现类型,将所述语音响应信息提供给所述用户。5.根据权利要求1至4中任一项所述的方法,其中,该方法还包括步骤:-根据所述自然语言命令与所述场景信息,确定对应的目标呈现信息;其中,所述步骤d包括:-将所述语音响应信息和所述目标呈现信息提供给所述用户。6.根据权利要求5所述的方法,其中,该方法还包括步骤:-检测是否满足提供所述目标呈现信息的提供条件;其中,所述步骤d包括:-若满足所述提供条件,将所述语音响应信息和所述目标呈现信息提供给所述用户。7.根据权利要求6所述的方法,其中,所述步骤d还包括:-若不满足所述提供条件,将所述语音响应信息提供给所述用户。8.根据权利要求1至7中任一项所述的方法,其中,若所述用户为多个,所述自然语言命令为多个所述用户之间的对话。9.一种用于提供语音响应信息的提供设备,其中,该提供设备包括:获取装置,用于获取用户输入的自然语言命令,以及所述用户输入所述自然语言命令时所伴随的背景音;第一确定装置,用于根据所述背景音,确定对应的场景信息;第二确定装置,用于根据所述自然语...

【专利技术属性】
技术研发人员:张伟萌戴帅湘
申请(专利权)人:北京小蓦机器人技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1