【技术实现步骤摘要】
语音交互方法和系统
本专利技术涉及语音处理
,尤其涉及一种语音交互方法和系统。
技术介绍
随着汽车工业的发展,车载逐渐成为人们生活中的一个重要场景。由于安全性的要求和移动互联的发展,人们已经逐渐习惯了通过语音输入对车载设备进行操控。通过语音输入对车载设备进行操控时,如果同时有多人说话,语音交互系统就难以区分出目标指令,为此,通常会要求除了指令的发出者之外的其他人尽量不要说话,但是,这种方式由于增加了对用户的限制,会使得语音交互系统的适应范围受限,并且也会影响用户体验。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种语音交互方法,该方法可以在多人说话的场景下依然可以识别出目标声源,从而扩大语音交互系统的适用范围,提升用户体验。本专利技术的另一个目的在于提出一种语音交互系统。为达到上述目的,本专利技术第一方面实施例提出的语音交互方法,包括:确定目标用户,并获取目标用户的用户信息;在需要语音交互时,获取多人同时说话时的混合声源,以及,根据目标用户的用户信息,在所述混合声源中识别出目标声源;对目标声源中的 ...
【技术保护点】
一种语音交互方法,其特征在于,包括:确定目标用户,并获取目标用户的用户信息;在需要语音交互时,获取多人同时说话时的混合声源,以及,根据目标用户的用户信息,在所述混合声源中识别出目标声源;对目标声源中的语音信息进行语音识别,得到语音识别结果,并将所述语音识别结果作为目标指令对交互设备进行操控。
【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:确定目标用户,并获取目标用户的用户信息;在需要语音交互时,获取多人同时说话时的混合声源,以及,根据目标用户的用户信息,在所述混合声源中识别出目标声源;对目标声源中的语音信息进行语音识别,得到语音识别结果,并将所述语音识别结果作为目标指令对交互设备进行操控;所述用户信息包括:声纹信息和方位信息;其中,当根据目标用户的方位信息和声纹信息进行识别时,先根据方位信息排除掉部分的声源,在剩下的声源中再逐一比对声纹信息,从而确定出目标声源;所述确定目标用户,包括:接收用户输入的预设语音指令;根据预设语音指令进行声纹登录;在声纹登录成功后,将当前登录的用户确定为目标用户;以及,对所述预设语音指令采用声源定位技术,确定出目标用户的方位信息;其中,当前登录的用户为后续需要进行语音操控的用户,且在其他已登录用户退出后进行登录操作;还包括:接收唤醒指令,并根据唤醒指令激活语音交互系统,以便在激活后提供语音交互服务,其中,所述唤醒指令包括:语音形式的唤醒指令。2.根据权利要求1所述的方法,其特征在于,所述获取目标用户的用户信息,包括:根据用户注册时保存的声纹信息,获取与当前登录的用户对应的声纹信息;和/或,采集当前登录的用户的声音信息,并对所述声音信息进行声源定位处理,确定当前登录的用户的方位信息。3.根据权利要求1-2任一项所述的方法,其特征在于,所述根据目标用户的用户信息,在所述混合声源中识别出目标声源,包括:采用听觉场景分析技术,将所述混合声源区分为单个声源;根据目标用户的用户信息,与单个声源的相应信息进行比对,识别出目标声源。4.根据权利要求1-2任一项所述的方法,其特征在于,所述获取多人同时说话时的混合声源,包括:采用降噪麦克风,获取多人同时说话时的混合声源。5.根据权利要求1-2任一项所述的方法,其特征在于,所述交互设备包括:车载设备。6.一种语音...
【专利技术属性】
技术研发人员:穆向禹,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。