交互方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37397114 阅读:14 留言:0更新日期:2023-04-30 09:25
本发明专利技术涉及人机交互技术领域,提供一种交互方法、装置、电子设备和存储介质,其中方法包括:在进入当前次交互模式后,实时采集用户语音;基于所述用户语音对应用户相对本端设备的位姿信息、所述用户语音的交互关联信息,以及所述本端设备的交互模式记录中的至少一种,确定是否回应所述用户语音;在确定回应所述用户语音的情况下,基于所述用户语音进行交互。本发明专利技术提供的方法、装置、电子设备和存储介质,在当前次交互模式下,实时采集用户语音,为一次唤醒多次交互提供条件。在实现一次唤醒多次交互的场景下,避免了本端设备误应答非交互语音的问题,使得人机交互能够像与人沟通一样流畅和自然,提高了人机交互的便利性。提高了人机交互的便利性。提高了人机交互的便利性。

【技术实现步骤摘要】
交互方法、装置、电子设备和存储介质


[0001]本专利技术涉及人机交互
,尤其涉及一种交互方法、装置、电子设备和存储介质。

技术介绍

[0002]现有的机器人在与人交互过程中,用户每次交互都需要加唤醒词,才能让机器人识别是在与自己交互,例如,用户在使用阿尔法蛋大蛋机器人,每次沟通都要加含有“蛋蛋你好”的前置唤醒词,然后才会进行后续的交互。
[0003]但是对于用户来说,用户不能像与人沟通一样,连贯和自然地与机器交互,人机交互的繁琐操作,使得用户体验感降低。

技术实现思路

[0004]本专利技术提供一种交互方法、装置、电子设备和存储介质,用以解决用户每次交互都需要加唤醒词,才能唤醒机器进行交互,操作繁琐的问题。
[0005]本专利技术提供一种交互方法,包括:
[0006]在进入当前次交互模式后,实时采集用户语音;
[0007]基于所述用户语音对应用户相对本端设备的位姿信息、所述用户语音的交互关联信息,以及所述本端设备的交互模式记录中的至少一种,确定是否回应所述用户语音;
[0008]在确定回应所述用户语音的情况下,基于所述用户语音进行交互。
[0009]根据本专利技术提供的一种交互方法,所述交互关联信息的确定步骤包括:
[0010]对所述用户语音进行语音转写,得到转写文本;
[0011]基于所述转写文本与所述本端设备的唤醒词之间的第一相关性,和/或,所述转写文本与所述当前次交互模式下的历史会话文本之间的第二相关性,确定所述交互关联信息
[0012]根据本专利技术提供的一种交互方法,所述转写文本与所述本端设备的唤醒词之间的第一相关性的确定步骤包括:
[0013]提取所述转写文本中的关键词;
[0014]基于所述关键词与所述唤醒词中的各唤醒分词之间的相关性,确定所述第一相关性。
[0015]根据本专利技术提供的一种交互方法,所述转写文本与所述当前次交互模式下的历史会话文本之间的第二相关性的确定步骤包括:
[0016]基于所述历史会话文本,进行会话预测,得到预设会话文本;
[0017]基于所述预设会话文本与所述转写文本之间的相关性,确定所述第二相关性。
[0018]根据本专利技术提供的一种交互方法,所述位姿信息的确定步骤包括:
[0019]对所述用户语音对应的用户进行距离检测和/或朝向检测;
[0020]基于检测所得的所述用户语音对应的用户与所述本端设备之间的距离,和/或所
述用户语音对应的用户相对于所述本端设备的朝向,确定所述位姿信息。
[0021]根据本专利技术提供的一种交互方法,所述交互模式记录的确定步骤包括:
[0022]基于所述本端设备当前次开机后执行交互模式的次数,以及所述当前次交互模式在当前次开机后的交互序号,确定所述交互模式记录。
[0023]根据本专利技术提供的一种交互方法,在所述实时采集用户语音,之前还包括:
[0024]在采集到携带所述本端设备的唤醒词的唤醒语音的情况下,进入所述当前次交互模式;
[0025]在进入所述当前次交互模式之后,还包括:
[0026]在预设时长内未采集到待回应的用户语音的情况下,退出所述当前次交互模式。
[0027]本专利技术还提供一种交互装置,包括:
[0028]采集单元,用于在进入当前次交互模式后,实时采集用户语音;
[0029]分析单元,用于基于所述用户语音对应用户相对本端设备的位姿信息、所述用户语音的交互关联信息,以及所述本端设备的交互模式记录中的至少一种,确定是否回应所述用户语音;
[0030]交互单元,用于在确定回应所述用户语音的情况下,基于所述用户语音进行交互。
[0031]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述交互方法。
[0032]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述交互方法。
[0033]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述交互方法。
[0034]本专利技术提供的一种交互方法、装置、电子设备和存储介质,通过在当前次交互模式下,实时采集用户语音,为一次唤醒多次交互提供条件。在此基础上,基于用户语音对应用户相对本端设备的位姿信息、用户语音的交互关联信息,以及本端设备的交互模式记录中的至少一种,确定是否回应所述用户语音,由此区分交互模式下采集得到的用户语音是否为交互语音,进而实现人机交互。在实现一次唤醒多次交互的场景下,避免了本端设备误应答非交互语音的问题,使得人机交互能够像与人沟通一样流畅和自然,提高了人机交互的便利性。
附图说明
[0035]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0036]图1是本专利技术提供的交互方法的流程示意图之一;
[0037]图2是本专利技术提供的确定第一相关性的流程示意图;
[0038]图3是本专利技术提供的确定第二相关性的流程示意图;
[0039]图4是本专利技术提供的确定位姿信息的流程示意图;
[0040]图5是本专利技术提供的交互方法的流程示意图之二;
[0041]图6是本专利技术提供的交互装置的结构示意图;
[0042]图7是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0043]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0044]现有的人机交互过程中,用户每次交互都需要加唤醒词,才能唤醒机器进行交互,如此一来,用户不能像与人沟通一样连贯和自然地与机器交互,使得用户体验感降低。
[0045]针对上述问题,本专利技术提供一种交互方法,以实现在首次交互唤
[0046]醒机器之后,然后在一定条件下,后续交互内容无需涉及唤醒词,即5像人与人之间交互一样便利、自然。图1是本专利技术提供的交互方法的流程示意图之一,如图1所示,该方法可以应用于包括交互机器人在内的各种智能终端,此处记为本端设备,该方法包括:
[0047]步骤110,在进入当前次交互模式后,实时采集用户语音;
[0048]此处,当前次交互模式,指的是用户通过唤醒词唤醒本端设备后0所进入的交互模式。可以理解的是,一次交互模式对应一个完整的对
[0049]话流程。即,在本端设备被唤醒,并完成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种交互方法,其特征在于,包括:在进入当前次交互模式后,实时采集用户语音;基于所述用户语音对应用户相对本端设备的位姿信息、所述用户语音的交互关联信息,以及所述本端设备的交互模式记录中的至少一种,确定是否回应所述用户语音;在确定回应所述用户语音的情况下,基于所述用户语音进行交互。2.根据权利要求1所述的交互方法,其特征在于,所述交互关联信息的确定步骤包括:对所述用户语音进行语音转写,得到转写文本;基于所述转写文本与所述本端设备的唤醒词之间的第一相关性,和/或,所述转写文本与所述当前次交互模式下的历史会话文本之间的第二相关性,确定所述交互关联信息。3.根据权利要求2所述的交互方法,其特征在于,所述转写文本与所述本端设备的唤醒词之间的第一相关性的确定步骤包括:提取所述转写文本中的关键词;基于所述关键词与所述唤醒词中的各唤醒分词之间的相关性,确定所述第一相关性。4.根据权利要求2所述的交互方法,其特征在于,所述转写文本与所述当前次交互模式下的历史会话文本之间的第二相关性的确定步骤包括:基于所述历史会话文本,进行会话预测,得到预设会话文本;基于所述预设会话文本与所述转写文本之间的相关性,确定所述第二相关性。5.根据权利要求1所述的交互方法,其特征在于,所述位姿信息的确定步骤包括:对所述用户语音对应的用户进行距离检测和/或朝向检测;基于检测所得的所述用户语音对应的用户与所述本端设备之间的距离,和/或所述用户语音对应的用户相对于所述本端设备的朝向,确定所述位姿信息。6.根据权利要求1所述的交互方法,其特征在于,...

【专利技术属性】
技术研发人员:刘庆升唐锐王晓斐朱翠玲姜文杨
申请(专利权)人:安徽淘云科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1