语音处理方法和系统、及语音交互设备和方法技术方案

技术编号：30067988 阅读：14 留言：0更新日期：2021-09-18 08:19

提出了一种语音处理方法和系统、及语音交互设备和方法，其中该语音处理方法包括：接收来自用户的语音数据；确定所述用户的用户身份；以及基于所述用户身份，生成所述语音数据的处理结果。本发明专利技术能够依据用户身份提供个性化语音交互服务，能够根据不同用户的不同喜好，推荐出非精确意图场景下不同的信息服务流组合。组合。组合。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法和系统、及语音交互设备和方法

[0001]本专利技术涉及信息处理领域，尤其涉及一种语言处理方法和系统，以及语音交互设备和方法。

技术介绍

[0002]智能语音助手已逐渐普及，成为许多用户生活中不可或缺的一部分。语音助手除了以最常见的音箱型态出现在用户家中之外，也开始出现在诸如车娱系统、智能手机、可穿戴智能设备之中。当前大部分智能语音交互采用的是单指令单服务形式，单个用户指令需要用明确的用户意图，并且只有单个服务形式，这种相对固定的语音反馈方式会给用户带来机械呆板的感觉，与智能语音产品的“智能”初衷背道而驰。
[0003]为此，需要一种更为灵活的语音交互反馈方案。

技术实现思路

[0004]为了解决如上至少一个问题，本专利技术提出了一种能够依据用户身份提供个性化语音交互服务的方案。该方案根据不同用户的不同喜好，推荐出非精确意图场景下不同的信息服务流组合。
[0005]根据本专利技术的第一方面，提出了一种语音处理方法，包括：接收来自用户的语音数据；确定所述用户的用户身份；以及基于所述用户身份，生成所述语音数据的处理结果。
[0006]根据本专利技术的第二方面，提出了一种语音处理系统，包括服务器以及多个语音交互设备，其中：所述语音交互设备用于：接收来自用户的语音数据；确定所述用户的用户身份；向所述服务器上传所述语音数据和所述用户身份，所述服务器用于：对所述语音数据进行处理；以及基于用户身份，生成并下发所述语音数据的处理结果。
[0007]根据本专利技术的第三方面，...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，包括：接收来自用户的语音数据；确定所述用户的用户身份；以及基于所述用户身份，生成所述语音数据的处理结果。2.如权利要求1所述的方法，其中，确定所述用户的用户身份包括如下至少一项：识别所述用户的生物信息并基于所述生物信息确定所述用户身份；识别所述用户的账户信息并基于所述账户信息确定所述用户身份。3.如权利要求2所述的方法，其中，识别所述用户的生物信息并基于所述生物信息确定所述用户身份包括：对所述语音数据进行声纹识别，并根据识别出的声纹确定所述用户身份；对所述用户的指纹进行识别，并根据识别出的指纹确定所述用户身份；对所述用户进行图像识别，并根据识别出的图像特征确定所述用户身份。4.如权利要求2所述的方法，还包括：采集多个用户各自的生物信息并生成身份信息库，并且识别所述用户的生物信息并基于所述生物信息确定所述用户身份包括：将获取的所述用户的生物信息与所述身份信息库内存储的生物信息相比较；以及根据比较结果，确定所述用户身份。5.如权利要求1所述的方法，其中，基于所述用户身份，生成所述语音数据的处理结果包括：基于所述用户身份，获取所述用户的画像信息和历史信息；以及基于所述画像信息和历史信息，生成所述语音数据的处理结果。6.如权利要求5所述的方法，其中，生成所述语音数据的处理结果还包括：获取所述语音数据的场景和/或上下文信息；基于所述场景和/或上下文信息，生成所述语音数据的处理结果。7.如权利要求6所述的方法，其中，生成所述语音数据的处理结果还包括：基于所述场景和/或上下文信息，从所述画像信息和历史信息中筛选所需的用户信息；以及基于筛选出的用户信息，生成所述语音数据的处理结果。8.如权利要求5所述的方法，其中，所述画像信息和历史信息包括如下至少一项：所述用户使用当前语音交互设备时获取的画像信息和历史信息；以及所述用户使用关联账户和/或设备时获取的画像信息和历史信息。9.如权利要求8所述的方法，还包括：基于所述用户针对如下至少一项的操作，创建和/或更新所述画像信息和历史信息：所述当前语音交互设备；其他关联账户；以及其他关联设备。10.如权利要求1所述的方法，其中，基于所述用户身份，生成所述语音数据的处理结果包括：基于所述用户身份，确定所述语音数据的领域意图；以及
基于所述领域意图，生成所述语音数据的处理结果。11.如权利要求1所述的方法，其中，基于所述用户身份，生成所述语音数据的处理结果包括：基于所述用户身份，确定所述语音数据本身的领域意图之外的附加领域意图；以及基于所述附加领域意图，生成所述语音数据的附加处理结果。12.如权利要求1所述的方法，还包括：向所述用户提供基于所述语音数据的处理结果的服务。13.如权利要求12所述的方法，其中，所述服务包括多个服务，每个服务涉及对应的关联操作，所述多个关联操作包括如下至少一项：相继执行的同类操作；以及同时执行的异类操作。14.如权利要求13所述的方法，其中，所述关联操作包括如下至少一项：声音播放；视觉呈现；以及其他设备控制。15.如权利要求14所述的方法，其中，所述声音播放包括语音反馈，所述语音反馈的形式基于所述用户身份确定。16.如权利要求12所述的方法，其中，向所述用户提供基于所述语音数据的处理结果的服务包括：向所述用户提供对应于相同或不同服务的信息流。17.一种语音处理系统，包括语音交互设备和服务器，所述语音交互设备用于：接收来自用户的语音数据；确定所述用户的用户身份；向所述服务器上传所述语音数据和所述用户身份，以及所述服务器用于：基于所述用户身份，生成所述语音数据的处理结果。18.如权利要求17所述的系统，其中，所述语音交互设备用于：对所述语音数据进行声纹识别，并根据识别出的声纹确定所述用户身份。19.如权利要求18所述的系统，其中，所述语音交互设备用于：从生物识别组件或设备获取确定的用户身份。20.如权利要求19所述的系统，其中，所述生物识别组件或设备包括如下至少一项：指纹识别组件或设备；以及人脸识别组件或设备。21.如权利要求17所述的系统，其中，所述语音交互设备用于：采集多个用户各自的身份信息，所述身份信息用于确定用户身份；以及在本地或服务器上生成包括所述身份信息的身份信息库。22.如权利要求21所述的系统，其中，所述语音交互设备用于：获取所述用户的身份信息；
将获取的所述用户的生物信息与所述身份信息库内存储的身份信息相比较；以及根据比较结果，确定所述用户身份。23.如权利要求17所述的系统，其中，所述服务器用于：基于所述用户身份，查询所述用户的画像信息和历史信息；以及基于所述画像信息和历史信息，生成所述语音数据的处理结果。24.如权利要求23所述的系统，其中，所述服务器用于：获取所述语音数据的场景和/或上下文信息；基于所述场景和/或上下文信息，从所述画像信息和历史信息中筛选所需的用户信息；以及基于筛选出...

【专利技术属性】
技术研发人员：张平，袁怀宾，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人