语音交互方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:33480779 阅读:9 留言:0更新日期:2022-05-19 00:54
本公开提供了语音交互方法、装置、电子设备以及存储介质,涉及计算机技术领域,尤其涉及物联网、语音技术、人工智能等领域。具体实现方案为:响应于在输出与第一语音请求相对应的第一应答信息的过程中,接收到第二语音请求,确定当前环境信息;根据当前环境信息,确定与第二语音请求相对应的第二应答信息;以及输出第一应答信息和第二应答信息。第一应答信息和第二应答信息。第一应答信息和第二应答信息。

【技术实现步骤摘要】
语音交互方法、装置、电子设备以及存储介质


[0001]本公开涉及计算机
,尤其涉及物联网、语音技术、人工智能等领域,具体地,涉及一种语音交互方法、装置、电子设备以及存储介质。

技术介绍

[0002]语音交互是基于语音输入的新一代交互模式,可以识别语音信息,并反馈交互结果。语音交互应用于各类语音助手中。语音助手是一种智能型软件应用,可安装于手机、车机、电脑以及其他电子设备等多种终端上。通过语音助手实现智能对话与即时问答的智能交互,用于帮助用户解决一系列问题。

技术实现思路

[0003]本公开提供了一种语音交互方法、装置、电子设备以及存储介质。
[0004]根据本公开的一方面,提供了一种语音交互方法,包括:响应于在输出与第一语音请求相对应的第一应答信息的过程中,接收到第二语音请求,确定当前环境信息;根据所述当前环境信息,确定与所述第二语音请求相对应的第二应答信息;以及输出所述第一应答信息和所述第二应答信息。
[0005]根据本公开的另一方面,提供了一种语音交互装置,包括:第一确定模块,用于响应于在输出与第一语音请求相对应的第一应答信息的过程中,接收到第二语音请求,确定当前环境信息;第二确定模块,用于根据所述当前环境信息,确定与所述第二语音请求相对应的第二应答信息;以及输出模块,用于输出所述第一应答信息和所述第二应答信息。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的语音交互方法。
[0007]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开的语音交互方法。
[0008]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的语音交互方法。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1示意性示出了根据本公开实施例的可以应用语音交互方法及装置的示例性系统架构;
[0012]图2示意性示出了根据本公开实施例的语音交互方法的流程图;
[0013]图3示意性示出了根据本公开实施的语音交互方法在导航类语音助手中的应用流程图;
[0014]图4示意性示出了根据本公开实施例的语音交互装置的框图;以及
[0015]图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。
具体实施方式
[0016]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0017]在本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
[0018]在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
[0019]语音交互是通过用户向语音交互设备输入唤醒词,唤醒语音交互设备中的语音助手,由语音助手与用户之间的对答实现的交互。在用户唤醒语音助手的情况下,用户可以向语音助手输入与自己的需求相关的语音信息,语音助手识别到该语音信息后,可以对该语音信息进行特征提取分析,然后输出与用户的需求相关的识别结果。
[0020]在实际场景中,语音助手可能同时或在较短的时间段内接收到多条不同的语音信息。例如,在用户基于地图导航驾车出行的过程中,需要听语音导航或通过语音助手与地图导航互动。在驾驶舱内包括多个用户,如包括儿童类用户的情况下,驾驶人员需要一边驾驶,一边分神与儿童类用户互动,容易影响驾驶人员的驾驶安全。随着智能音响等智能产品在家庭的普及,儿童类用户对智能产品的使用及智能对话的熟悉程度也较高,如果在地图导航播报导航信息的过程中,儿童类用户与语音助手进行互动,会干扰正常的语音导航,影响驾驶人员的驾驶。
[0021]专利技术人在实现本公开构思的过程中发现,语音助手不能区分不同的语音输入源。在后台进行语音播报时,其他各种语音输入源均可以唤醒语音助手。在根据识别到的其他语音输入源确定用户需求后,语音助手会中断正在运行中的播报,反馈新的识别结果。此外,语音助手不能同时满足来自同一用户的不同输入需求。例如。导航类语音助手在播报导航的过程中,要语音助手播放歌曲,两个需求不能同时满足。
[0022]本公开提供了一种语音交互方法、装置、电子设备以及存储介质。语音交互方法包括:响应于在输出与第一语音请求相对应的第一应答信息的过程中,接收到第二语音请求,确定当前环境信息;根据当前环境信息,确定与第二语音请求相对应的第二应答信息;以及输出第一应答信息和第二应答信息。
[0023]图1示意性示出了根据本公开实施例的可以应用语音交互方法及装置的示例性系统架构。
[0024]需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、
系统、环境或场景。例如,在另一实施例中,可以应用语音交互方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的语音交互方法及装置。
[0025]如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
[0026]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
[0027]终端设备101、102、103可以是具有语音交互功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机和智能音箱等等,智能音箱可以包括车载智能音箱等等。
[0028]服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,包括:响应于在输出与第一语音请求相对应的第一应答信息的过程中,接收到第二语音请求,确定当前环境信息;根据所述当前环境信息,确定与所述第二语音请求相对应的第二应答信息;以及输出所述第一应答信息和所述第二应答信息。2.根据权利要求1所述的方法,其中,所述当前环境信息包括行驶状态信息;所述根据所述当前环境信息,确定与所述第二语音请求相对应的第二应答信息包括:响应于检测到所述行驶状态信息表征当前行驶状态为静止状态,确定所述第二应答信息为与所述第二语音请求所请求的内容相关的目标信息;以及响应于检测到所述行驶状态信息表征当前行驶状态为运动状态,确定所述第二应答信息为与所述第二语音请求所请求的内容无关的预定义信息。3.根据权利要求1所述的方法,其中,所述第一应答信息包括导航信息;所述当前环境信息包括所述导航信息所表征的行驶路线信息;所述根据所述当前环境信息,确定与所述第二语音请求相对应的第二应答信息包括:确定所述行驶路线信息所表征的当前行驶路线的历史行驶次数;响应于检测到所述历史行驶次数大于第一预设值,确定所述第二应答信息为与所述第二语音请求所请求的内容相关的目标信息;以及响应于检测到所述历史行驶次数小于或等于所述第一预设值,确定所述第二应答信息为与所述第二语音请求所请求的内容无关的预定义信息。4.根据权利要求1所述的方法,其中,所述第一应答信息包括导航信息;所述当前环境信息包括与当前行驶路线相关的行驶路况信息,所述当前行驶路线包括所述导航信息所表征的路线;所述根据所述当前环境信息,确定与所述第二语音请求相对应的第二应答信息包括:根据所述行驶路况信息确定所述当前行驶路线中的信号灯数目、转弯数目和摄像头数目其中至少之一;响应于检测到所述信号灯数目、所述转弯数目和所述摄像头数目其中至少之一大于第二预设值,确定所述第二应答信息为与所述第二语音请求所请求的内容相关的目标信息;以及响应于检测到所述信号灯数目、所述转弯数目和所述摄像头数目其中至少之一小于或等于所述第二预设值,确定所述第二应答信息为与所述第二语音请求所请求的内容无关的预定义信息。5.根据权利要求1所述的方法,其中,所述第二语音请求包括与儿童相关的语音请求;所述方法还包括:响应于在输出所述第一应答信息的过程中,接收到所述第二语音请求,在与所述第二语音请求相关的音频信息中增加与所述儿童相关的目标标识信息;以及对包括所述目标标识信息的音频信息进行特征提取,得到特征提取结果,以便根据所述特征提取结果确定与所述第二语音请求所请求的内容相关的目标信息。6.根据权利要求1所述的方法,其中,所述输出所述第一应答信息和所述第二应答信息包括:
在所述第一应答信息的输出间隙,输出所述第二应答信息。7.根据权利要求1所述的方法,其中,所述第二语音请求包括与儿童相关的语音请求;所述输出所述第一应答信息和所述第二应答信息包括:确定与所述儿童相关的应答角色;以及基于所述应答角色的音频信息,输出所述第二应答信息。8.一种语音交互装置,包括:第一确定模块,用于响应于在输出与第一语音请求相对应的第一应答信息的过程中,接收到第二语音请求,确定当前环境信息;第二确定模块,用于根据所述当前环境信息,确定与所述第二语音请求相对应的第二应答信息;以及输出模块,用于输出所述第一应答信息和所述第二应答信息。9.根据权利要求8所述的装置,其中,所述当前...

【专利技术属性】
技术研发人员:裴静陈宪涛
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1