语音交互方法和系统技术方案

技术编号：12778874 阅读：63 留言：0更新日期：2016-01-27 21:06

本发明专利技术提出一种语音交互方法和系统，该语音交互方法包括：确定目标用户，并获取目标用户的用户信息；在需要语音交互时，获取多人同时说话时的混合声源，以及，根据目标用户的用户信息，在所述混合声源中识别出目标声源；对目标声源中的语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果作为目标指令对交互设备进行操控。该方法能够在多人说话的场景下依然可以识别出目标声源，从而扩大语音交互系统的适用范围，提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
语音交互方法和系统
本专利技术涉及语音处理
，尤其涉及一种语音交互方法和系统。
技术介绍
随着汽车工业的发展，车载逐渐成为人们生活中的一个重要场景。由于安全性的要求和移动互联的发展，人们已经逐渐习惯了通过语音输入对车载设备进行操控。通过语音输入对车载设备进行操控时，如果同时有多人说话，语音交互系统就难以区分出目标指令，为此，通常会要求除了指令的发出者之外的其他人尽量不要说话，但是，这种方式由于增加了对用户的限制，会使得语音交互系统的适应范围受限，并且也会影响用户体验。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的一个目的在于提出一种语音交互方法，该方法可以在多人说话的场景下依然可以识别出目标声源，从而扩大语音交互系统的适用范围，提升用户体验。本专利技术的另一个目的在于提出一种语音交互系统。为达到上述目的，本专利技术第一方面实施例提出的语音交互方法，包括：确定目标用户，并获取目标用户的用户信息；在需要语音交互时，获取多人同时说话时的混合声源，以及，根据目标用户的用户信息，在所述混合声源中识别出目标声源；对目标声源中的...
语音交互方法和系统

【技术保护点】
一种语音交互方法，其特征在于，包括：确定目标用户，并获取目标用户的用户信息；在需要语音交互时，获取多人同时说话时的混合声源，以及，根据目标用户的用户信息，在所述混合声源中识别出目标声源；对目标声源中的语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果作为目标指令对交互设备进行操控。

【技术特征摘要】
1.一种语音交互方法，其特征在于，包括：确定目标用户，并获取目标用户的用户信息；在需要语音交互时，获取多人同时说话时的混合声源，以及，根据目标用户的用户信息，在所述混合声源中识别出目标声源；对目标声源中的语音信息进行语音识别，得到语音识别结果，并将所述语音识别结果作为目标指令对交互设备进行操控；所述用户信息包括：声纹信息和方位信息；其中，当根据目标用户的方位信息和声纹信息进行识别时，先根据方位信息排除掉部分的声源，在剩下的声源中再逐一比对声纹信息，从而确定出目标声源；所述确定目标用户，包括：接收用户输入的预设语音指令；根据预设语音指令进行声纹登录；在声纹登录成功后，将当前登录的用户确定为目标用户；以及，对所述预设语音指令采用声源定位技术，确定出目标用户的方位信息；其中，当前登录的用户为后续需要进行语音操控的用户，且在其他已登录用户退出后进行登录操作；还包括：接收唤醒指令，并根据唤醒指令激活语音交互系统，以便在激活后提供语音交互服务，其中，所述唤醒指令包括：语音形式的唤醒指令。2.根据权利要求1所述的方法，其特征在于，所述获取目标用户的用户信息，包括：根据用户注册时保存的声纹信息，获取与当前登录的用户对应的声纹信息；和/或，采集当前登录的用户的声音信息，并对所述声音信息进行声源定位处理，确定当前登录的用户的方位信息。3.根据权利要求1-2任一项所述的方法，其特征在于，所述根据目标用户的用户信息，在所述混合声源中识别出目标声源，包括：采用听觉场景分析技术，将所述混合声源区分为单个声源；根据目标用户的用户信息，与单个声源的相应信息进行比对，识别出目标声源。4.根据权利要求1-2任一项所述的方法，其特征在于，所述获取多人同时说话时的混合声源，包括：采用降噪麦克风，获取多人同时说话时的混合声源。5.根据权利要求1-2任一项所述的方法，其特征在于，所述交互设备包括：车载设备。6.一种语音...

【专利技术属性】
技术研发人员：穆向禹，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人