语音交互方法及装置制造方法及图纸

技术编号:30269178 阅读:32 留言:0更新日期:2021-10-09 21:22
公开了一种语音交互方法和装置。提供一种语音交互方法,包括:检测第一用户语音;根据检测到的第一用户语音显示与第一用户语音相关联的多个候选对象以及与所述多个候选对象相应的对象增强信息;基于与所述多个候选对象相应的对象增强信息从所述多个候选对象中确定目标对象。目标对象。目标对象。

【技术实现步骤摘要】
语音交互方法及装置


[0001]本专利技术总体说来涉及语音交互
,更具体地讲,涉及一种语音交互方法及装置。

技术介绍

[0002]目前,随着智能电视的普及和发展,语音交互功能已经成为智能电视的必备功能之一,并且也已经在例如智能汽车、智能电话、智能音响、虚拟显示设备等诸多产品中被集成。人们可以方便地通过语音搜索来获取内容,例如寻找喜欢的歌曲或电影。目前的语音交互方式主要有两种:一种是近场方案,通过特定的语音键来开启或结束对话过程,在近场语音方案中,用户按住按键来开始对话,松开按键时对话结束,类似于对讲机的会话过程;另一种是远场方案,用户通过特定的唤醒词来控制开启对话,通过唤醒词来开始语音交互,在会话阶段可能会有多条语音交互,并且由一个特定的操作(或者确定或者会话超时)来标识会话阶段结束。
[0003]传统语音交互使用语音按键或唤醒词来开启和关闭语音对话。对于非触摸屏,或者AR虚拟屏等设备,由于对用户意图的识别和目标实体的理解存在不确定性,因此存在繁琐的语音提示。此外,传统语音交互具有句式固定、交互中易被外部声音打断等问题。而在本申请的语音交互方法中,用户可以通过系统呈现的启发式信息,实现人机交互,改善人机交互的自然性。通过交互中显示待选择目标所关联的可见或者不可见的增强信息(HOAI),可以帮助用户进行高效的语音意图反馈,去除主题不相关的语音和噪声干扰,避免多次重复语音交互会话,提高交互效率并改善用户体验。
[0004]提出上述信息作为背景信息仅为了帮助理解本申请。关于上述信息中的任何信息是否适合作为关于本申请的现有技术,没有做出任何确定,也没有做出任何断言。

技术实现思路

[0005]本申请的各方面至少解决上述问题和/或缺点,并至少提供下面描述的优点。
[0006]本申请的示例性实施例提供一种语音交互方法及装置。根据本申请的示例性实施例的语音交互方法及装置,在使用语音交互时,当在各种类型的显示界面上选择交互对象时,通过显示交互对象的关联对象增强信息来灵活地管理会话,从而实现类自然式的语音人机交互。
[0007]根据本申请的示例性实施例,提供一种语音交互方法,包括:检测第一用户语音;根据检测到的第一用户语音显示与第一用户语音相关联的多个候选对象以及与所述多个候选对象相应的对象增强信息;基于与所述多个候选对象相应的对象增强信息从所述多个候选对象中确定目标对象。
[0008]可选地,根据检测到的第一用户语音显示与第一用户语音相关联的多个候选对象以及与所述多个候选对象相应的对象增强信息包括:根据检测到的第一用户语音确定与第一用户语音相关联的多个候选对象;产生与所述多个候选对象相应的对象增强信息,其中,
产生与所述多个候选对象相应的对象增强信息的步骤包括:获取所述多个候选对象的上下文信息,基于所述多个候选对象的特性和上下文信息产生与所述多个候选对象相应的对象增强信息。
[0009]可选地,基于与所述多个候选对象相应的对象增强信息从所述多个候选对象中确定目标对象包括:接收用户输入或第二用户语音;将所述多个候选对象中具有与用户输入或第二用户语音匹配的对象增强信息的候选对象确定为目标对象。
[0010]可选地,基于与所述多个候选对象相应的对象增强信息从所述多个候选对象中确定目标对象包括:接收用户输入或第二用户语音;当基于与所述多个候选对象相应的对象增强信息以及用户输入或第二用户语音从所述多个候选对象中确定出多个候选目标对象时,基于所述多个候选目标对象的特性和上下文信息对与所述多个候选目标对象相应的对象增强信息进行更新,基于更新后的对象增强信息确定目标对象。
[0011]可选地,所述方法还包括:基于检测到的第一用户语音识别用户意图;基于与所述多个候选对象相应的对象增强信息和识别出的用户意图,规避不相干的外部语音或噪声。
[0012]可选地,所述方法还包括:接收第三用户语音,当第三用户语音的意图与识别出的用户意图不同时,根据第三用户语音重新确定候选对象,产生与重新确定的候选对象相应的对象增强信息。
[0013]根据本申请的示例性实施例,提供一种语音交互装置,包括:检测模块,检测第一用户语音;控制模块,根据检测到的第一用户语音显示与第一用户语音相关联的多个候选对象以及与所述多个候选对象相应的对象增强信息;确定模块,基于与所述多个候选对象相应的对象增强信息从所述多个候选对象中确定目标对象。
[0014]可选地,控制模块被配置为:根据检测到的第一用户语音确定与第一用户语音相关联的多个候选对象;产生与所述多个候选对象相应的对象增强信息,其中,产生与所述多个候选对象相应的对象增强信息包括:获取所述多个候选对象的上下文信息,基于所述多个候选对象的特性和上下文信息产生与所述多个候选对象相应的对象增强信息。
[0015]可选地,确定模块被配置为:获取通过检测模块接收的用户输入或第二用户语音;将所述多个候选对象中具有与用户输入或第二用户语音匹配的对象增强信息的候选对象确定为目标对象。
[0016]可选地,确定模块被配置为:获取通过检测模块接收的用户输入或第二用户语音;当基于与所述多个候选对象相应的对象增强信息以及用户输入或第二用户语音从所述多个候选对象中确定出多个候选目标对象时,获取通过控制模块基于所述多个候选目标对象的特性和上下文信息对与所述多个候选目标对象相应的对象增强信息进行更新而获得的更新后的对象增强信息,基于更新后的对象增强信息确定目标对象。
[0017]可选地,控制模块还被配置为:基于检测到的第一用户语音识别用户意图;基于与所述多个候选对象相应的对象增强信息和识别出的用户意图,规避不相干的外部语音或噪声。
[0018]可选地,控制模块还被配置为:获取通过检测模块接收的第三用户语音,当第三用户语音的意图与识别出的用户意图不同时,根据第三用户语音重新确定候选对象,产生与重新确定的候选对象相应的对象增强信息。
[0019]根据本申请的另一示例性实施例,提供一种存储指令的计算机可读存储介质,其
中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的语音交互方法。
[0020]根据本申请的另一示例性实施例,提供一种计算装置,包括:处理器;存储器,存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的语音交互方法。
[0021]根据本申请的示例性实施例的语音交互方法及装置,是一种启发式的语音交互方法或装置。该方法或装置可以基于交互对象的可见或者不可见的关联增强信息,通过启发式地内容呈现,有效地关联主题内容和避免外部语音打扰,同时自适应地管理交互会话期间的语音命令,从而处理语音交互单目标选择问题。本申请能够提供给用户类似自然语音交互的体验,规避有限的语音样例对用户引导教育不足而导致的语音交互普及性和便利性的问题。
[0022]附加的方面将在下面的描述中部分地阐述,并且部分地,将通过描述而清楚,或者可以通过本申请的实施例的实践来获知。
附图说明
[0023]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,包括:检测第一用户语音;根据检测到的第一用户语音显示与第一用户语音相关联的多个候选对象以及与所述多个候选对象相应的对象增强信息;基于与所述多个候选对象相应的对象增强信息从所述多个候选对象中确定目标对象。2.如权利要求1所述的方法,其中,根据检测到的第一用户语音显示与第一用户语音相关联的多个候选对象以及与所述多个候选对象相应的对象增强信息包括:根据检测到的第一用户语音确定与第一用户语音相关联的多个候选对象;产生与所述多个候选对象相应的对象增强信息,其中,产生与所述多个候选对象相应的对象增强信息的步骤包括:获取所述多个候选对象的上下文信息,基于所述多个候选对象的特性和上下文信息产生与所述多个候选对象相应的对象增强信息。3.如权利要求1所述的方法,其中,基于与所述多个候选对象相应的对象增强信息从所述多个候选对象中确定目标对象包括:接收用户输入或第二用户语音;将所述多个候选对象中具有与用户输入或第二用户语音匹配的对象增强信息的候选对象确定为目标对象。4.如权利要求1所述的方法,其中,基于与所述多个候选对象相应的对象增强信息从所述多个候选对象中确定目标对象包括:接收用户输入或第二用户语音;当基于与所述多个候选对象相应的对象增强信息以及用户输入或第二用户语音从所述多个候选对象中确定出多个候选目标对象时,基于所述多个候选目标对象的特性和上下文信息对与所述多个候选目标对象相应的对象增强信息进行更新,基于更新后的对象增强信息确定目标对象。5.如权利要求1所述的方法,其中,所述方法还包括:基于检测到的第一用户语音识别用户意图;基于与所述多个候选对象相应的对象增强信息和识别出的用户意图,规避不相干的外部语音或噪声。6.如权利要求5所述的方法,其中,所述方法还包括:接收第三用户语音,当第三用户语音的意图与识别出的用户意图不同时,根据第三用户语音重新确定候选对象,产生与重新确定的候选对象相应的对象增强信息。7.一种语音交互装置,包括:检测模块,检测第一用户语音;控制模块,根据检测到的第一用户语音显示与第一用户语音相关联的多...

【专利技术属性】
技术研发人员:刘明申立明柳艳马嘉林
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1