【技术实现步骤摘要】
一种语音指令响应方法、装置及终端设备
本专利技术涉及语音识别
,尤其涉及一种语音指令响应方法、装置及终端设备。
技术介绍
随着语音及自然语言处理相关技术的发展,越来越多的应用场景已支持通过语音方式与用户进行交互,因此准确识别用户发出的语音指令对应的用户意图越来越重要。自然语言理解(NaturalLanguageUnderstanding,NLU)技术中,用户意图是指用户想要通过语言表达的意图,就是在语言表达中所体现出的“用户想干什么”。一般情况下,用户意图由槽位来表达。即,将从语句中抽取出的特定概念,并将抽取出的特定概念转换为意图的槽位参数来表达用户的意图。然而,在用户与智能设备进行语音交互的过程中,常常会多个用户同时向智能设备输入语音指令的情况。例如:在一个用户想要看电影《哪吒》并输入语音指令“我要电影哪吒”的同时,另一个用户想要查询当地今天的天气情况下并输入“今天天气怎么样”,此时智能设备会同时接收到两个用户输入的不同语音指令,而智能设备并不能同时执行接收到的所有语音指令。在现有技术中,当智能设备同时接收到 ...
【技术保护点】
1.一种语音指令响应方法,其特征在于,应用于终端设备,所述方法包括:/n在接收到至少两个声源对象输入的至少两个语音指令的情况下,获取所述至少两个声源对象的声源信息,任一声源对象的声源信息包括该声源对象到所述终端设备的距离、该声源对象到所述终端设备的连线与所述终端设备正面朝向之间的加角,以及该声源对象输入的语音指令的音量中的至少一个;/n根据所述至少两个声源对象的声源信息确定所述至少两个声源对象中的目标声源对象;/n响应所述目标声源对象输入的语音指令。/n
【技术特征摘要】
1.一种语音指令响应方法,其特征在于,应用于终端设备,所述方法包括:
在接收到至少两个声源对象输入的至少两个语音指令的情况下,获取所述至少两个声源对象的声源信息,任一声源对象的声源信息包括该声源对象到所述终端设备的距离、该声源对象到所述终端设备的连线与所述终端设备正面朝向之间的加角,以及该声源对象输入的语音指令的音量中的至少一个;
根据所述至少两个声源对象的声源信息确定所述至少两个声源对象中的目标声源对象;
响应所述目标声源对象输入的语音指令。
2.根据权利要求1所述的方法,其特征在于,任一声源对象的声源信息包括该声源对象到所述终端设备的距离;
所述根据所述至少两个声源对象的声源信息确定所述至少两个声源对象中的目标声源对象,包括:
将所述至少两个声源对象中到所述终端设备的距离最小的声源对象确定为所述目标声源对象。
3.根据权利要求2所述的方法,其特征在于,任一声源对象的声源信息还包括该声源对象到所述终端设备的连线与所述终端设备正面朝向之间的加角,所述方法还包括:
当到所述终端设备的距离最小的声源对象包括N个声源对象时,将所述N个声源对象中到所述终端设备的连线与所述终端设备正面朝向之间的加角最小的声源对象确定为所述目标声源对象;
N为大于1的整数。
4.根据权利要求1所述的方法,其特征在于,任一声源对象的声源信息包括该声源对象到所述终端设备的连线与所述终端设备正面朝向之间的加角;
所述根据所述至少两个声源对象的声源信息确定所述至少两个声源对象中的目标声源对象,包括:
将所述至少两个声源对象中到所述终端设备的连线与所述终端设备正面朝向之间的加角最小的声源对象确定为所述目标声源对象。
5.根据权利要求1所述的方法,其特征在于,任一声源对象的声源信息包括该声源对象输入的语音指令的音量;
所述根据所述至少两个声源对象的声源信息确定所述至少两个声源对象中的目标声源对象,包括:
将所述至少两个声源对象中输入的语音指令的音量最大的声源对象确定为所述目标声源对象。
6.根据权利要求1所述的方法,其特征在于,任一声源对象的声源信息包括该声源对象到所述终端设备的距离、该声源对象到所述终端设备的连线与所述终端设备正面朝向之间的加角,以及该声源对象输...
【专利技术属性】
技术研发人员:杜国威,
申请(专利权)人:北京安云世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。