语音交互方法、装置、智能机器人及计算机可读存储介质制造方法及图纸

技术编号:21774540 阅读:24 留言:0更新日期:2019-08-03 22:22
本发明专利技术实施例提供一种语音交互方法、装置、智能机器人及计算机可读存储介质。该方法应用于智能机器人,该方法包括:在语音交互场景下,获得交互对象的对象特征信息;按照与对象特征信息匹配的语音播报参数,与交互对象进行语音交互。可见,本发明专利技术实施例中,智能机器人可以根据交互对象的实际情况,对所使用的语音播报参数进行灵活地调整,也就是说,智能机器人使用的语音交互策略是多样化和个性化的,因此,与现有技术中使用固定的语音交互策略的情况相比,本发明专利技术实施例中,智能机器人能够提供更为人性化的服务,语音交互效果能够得到有效地提升。

Speech Interaction Method, Device, Intelligent Robot and Computer Readable Storage Media

【技术实现步骤摘要】
语音交互方法、装置、智能机器人及计算机可读存储介质
本专利技术实施例涉及机器人
,尤其涉及一种语音交互方法、装置、智能机器人及计算机可读存储介质。
技术介绍
随着语音识别的准确度和语义理解能力的不断提升,智能机器人越来越受到市场的青睐,智能机器人的使用越来越普遍。在智能机器人为用户服务的过程中,智能机器人往往会与用户进行语音交互。一般而言,在各种情况下,智能机器人均使用固定的语音交互策略,那么,智能机器人进行语音交互时使用的策略非常单一,这样会导致语音交互效果较差。
技术实现思路
本专利技术实施例提供一种语音交互方法、装置、智能机器人及计算机可读存储介质,以解决智能机器人进行语音交互时使用的策略单一,导致语音交互效果较差的问题。为了解决上述技术问题,本专利技术是这样实现的:第一方面,本专利技术实施例提供一种语音交互方法,应用于智能机器人,所述方法包括:在语音交互场景下,获得交互对象的对象特征信息;按照与所述对象特征信息匹配的语音播报参数,与所述交互对象进行语音交互。第二方面,本专利技术实施例提供一种语音交互装置,应用于智能机器人,所述装置包括:获得模块,用于在语音交互场景下,获得交互对象的对象特征信息;交互模块,用于按照与所述对象特征信息匹配的语音播报参数,与所述交互对象进行语音交互。第三方面,本专利技术实施例提供一种智能机器人,包括处理器,存储器,存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述语音交互方法的步骤。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述语音交互方法的步骤。本专利技术实施例中,在语音交互场景下,智能机器人可以获得交互对象的对象特征信息,并按照与对象特征信息匹配的语音播报参数,与交互对象进行语音交互。可见,本专利技术实施例中,智能机器人可以根据交互对象的实际情况,对所使用的语音播报参数进行灵活地调整,也就是说,智能机器人使用的语音交互策略是多样化和个性化的,因此,与现有技术中使用固定的语音交互策略的情况相比,本专利技术实施例中,智能机器人能够提供更为人性化的服务,语音交互效果能够得到有效地提升。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获取其他的附图。图1是本专利技术实施例提供的语音交互方法的流程图之一;图2是本专利技术实施例提供的语音交互方法的流程图之二;图3是本专利技术实施例提供的语音交互方法的流程图之三;图4是本专利技术实施例提供的语音交互方法的流程图之四;图5是本专利技术实施例提供的语音交互装置的结构框图;图6是本专利技术实施例提供的智能机器人的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本专利技术保护的范围。参见图1,图中示出了本专利技术实施例提供的语音交互方法的流程图之一。如图1所示,该方法应用于智能机器人,该方法包括如下步骤:步骤101,在语音交互场景下,获得交互对象的对象特征信息。这里,交互对象也可以称之为智能机器人的服务对象。可选地,对象特征信息中可以包括以下至少一项:对象语音输出参数、对象情绪和对象属性;其中,对象语音输出参数中包括对象语速、对象音量和对象音色中的至少一项,对象属性中包括对象年龄属性、对象性别属性和对象肤色属性中的至少一项。这里,对象年龄属性可以包括儿童属性、青年属性、中年属性、老年属性等;对象性别属性可以包括男性属性、女性属性等;对象肤色属性可以包括黄皮肤属性、白皮肤属性、黑皮肤属性等。步骤102,按照与对象特征信息匹配的语音播报参数,与交互对象进行语音交互。这里,语音播报参数包括但不限于语音播报速度、语音播报音量、语音播报音色等。在获得交互对象的对象特征信息之后,智能机器人可以确定与所获得的对象特征信息匹配的语音播报参数;其中,与任一对象特征信息匹配的语音播报参数是指:能够给具有该对象特征信息的对象带来较好的交互体验的语音播报参数。这样,在智能机器按照所确定的语音播报参数,与交互对象进行语音交互的情况下,交互对象的交互体验能够得到保证,相应地,语音交互效果也能够得到保证。本专利技术实施例中,在语音交互场景下,智能机器人可以获得交互对象的对象特征信息,并按照与对象特征信息匹配的语音播报参数,与交互对象进行语音交互。可见,本专利技术实施例中,智能机器人可以根据交互对象的实际情况,对所使用的语音播报参数进行灵活地调整,也就是说,智能机器人使用的语音交互策略是多样化和个性化的,因此,与现有技术中使用固定的语音交互策略的情况相比,本专利技术实施例中,智能机器人能够提供更为人性化的服务,语音交互效果能够得到有效地提升。可选地,获得交互对象的对象特征信息,包括:统计交互对象在目标时长内的语音输出字数,并根据目标时长和语音输出字数,计算交互对象的对象语速。这里,目标时长可以为一设定的时长;或者,目标时长可以为智能机器人随机确定的一时长。具体地,目标时长可以为1分钟、2分钟、5分钟或者其他时长,在此不再一一列举。具体地,在统计出交互对象在目标时长(例如2分钟)内的语音输出字数之后,根据目标时长和统计出的语音输出字数,可以计算得到交互对象在单位时间内的语音输出字数,例如,可以将统计出的语音输出字数与2分钟相除,以得到交互对象在1分钟内的语音输出字数。之后,智能机器人可以将交互对象在单位时间内的语音输出字数作为交互对象的对象语速。可见,得到交互对象的对象语速的操作实施起来非常便捷。可选地,智能机器人包括摄像头;获得交互对象的对象特征信息,包括:调用摄像头采集交互对象的面部图像,并根据面部图像,获得交互对象的对象情绪。这里,智能机器人包括的摄像头具体可以为前置摄像头。具体地,在调用摄像头采集交互对象的面部图像之后,智能机器人可以对所采集的面部图像进行分析,以确定面部图像中是否存在能够体现焦虑情绪的面部特征,例如皱眉,面部绷紧、表情紧张等。在确定结果为存在的情况下,智能机器人可以判定交互对象的对象情绪为焦虑情绪;在确定结果为不存在的情况下,智能机器人可以判定交互对象的对象情绪为非焦虑情绪。需要说明的是,对象属性也可以通过对调用摄像头采集的面部图像进行分析得到。可见,得到交互对象的对象情绪的操作实施起来非常便捷。参见图2,图中示出了本专利技术实施例提供的语音交互方法的流程图之二。如图2所示,该方法应用于智能机器人,该方法包括如下步骤:步骤201,在语音交互场景下,获得交互对象的对象特征信息;其中,对象特征信息中包括对象语音输出参数,对象语音输出参数中包括对象语速。这里,交互对象也可以称之为智能机器人的服务对象。需要说明的是,对象语音输出参数中除了包括对象语速之外,还可以包括对象音量和对象音色中的至少一项;对象特征信息中除了包括对象语音输出参数之外,还可以包括对象情绪和对象属性中的至少一项,对象属性中可以包括本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,应用于智能机器人,所述方法包括:在语音交互场景下,获得交互对象的对象特征信息;按照与所述对象特征信息匹配的语音播报参数,与所述交互对象进行语音交互。

【技术特征摘要】
1.一种语音交互方法,其特征在于,应用于智能机器人,所述方法包括:在语音交互场景下,获得交互对象的对象特征信息;按照与所述对象特征信息匹配的语音播报参数,与所述交互对象进行语音交互。2.根据权利要求1所述的方法,其特征在于,所述对象特征信息中包括以下至少一项:对象语音输出参数、对象情绪和对象属性;其中,所述对象语音输出参数中包括对象语速、对象音量和对象音色中的至少一项,所述对象属性中包括对象年龄属性、对象性别属性和对象肤色属性中的至少一项。3.根据权利要求2所述的方法,其特征在于,所述对象特征信息中包括对象语音输出参数,所述对象语音输出参数中包括对象语速;所述按照与所述对象特征信息匹配的语音播报参数,与所述交互对象进行语音交互,包括:确定所述对象语速对应的语音播报速度;以所述语音播报速度,与所述交互对象进行语音交互。4.根据权利要求2所述的方法,其特征在于,所述对象特征信息中包括对象情绪;所述按照与所述对象特征信息匹配的语音播报参数,与所述交互对象进行语音交互,包括:在所述对象情绪为焦急情绪的情况下,以第一语音播报速度与所述交互对象进行语音交互;否则,以第二语音播报速度与所述交互对象进行语音交互;其中,所述第一语音播报速度快于所述第二语音播报速度。5.根据权利要求2所述的方法,其特征在于,所述对象特征信息中包括对象属性,所述对象属性中包括对象年龄属性;所述按照与所述对象特征信息匹配的语音播报参数,与所述交互对象进行语音交互,包括:确定所述年龄属性对应的语音播报音色;以所述语音播报音色,与所述交互对象进行语音交互。6.根据权利要求2所述的方法,其特征在于,所述获得交互对象的对象特征信息,包括:统计交互对象在目标时长内的语音输出字数,并根据所述目标时长和所述语音输出字数,计算所述交互对象的对象语速;和/或,所述智能机器人包括摄像头;所述获得交互对象的对象特征信息,包括:调用所述摄像头采集交互对象的面部图像,并根据所述面部图像,获得所述交互对象的对象情绪。7.一种语音交互装置,其特征在于,应用于智能机器人,所述装置包括:获得模块,用于在语音交互场景下,获得交互对象的对象特征信息;交互...

【专利技术属性】
技术研发人员:李财瑜
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1