语音处理方法和分布式系统、及语音交互设备和方法技术方案

技术编号：28050520 阅读：23 留言：0更新日期：2021-04-14 13:08

提出了一种语音处理方法和分布式系统、及语音交互设备和方法，其中该语音处理方法包括：接收语音数据；对所述语音数据进行处理；以及基于场景信息，生成所述语音数据的处理结果。由此，能够为用户提供更符合当前需要的处理结果。本发明专利技术的语音处理方案可以通过对场景信息的获取和判断推测出用户的当前关注度水平，并且给出与用户的所述关注度水平相适应的反馈内容。进一步地，该方案还可以根据关注度水平和当前语音设备的交互条件，确定交互的具体形式，由此灵活应对不同的应用场景，并提供各自最优的使用体验。各自最优的使用体验。各自最优的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法和分布式系统、及语音交互设备和方法

[0001]本专利技术涉及信息处理领域，尤其涉及一种语言处理方法和分布式系统，以及语音交互设备和方法。

技术介绍

[0002]智能语音助手已逐渐普及，成为许多用户生活中不可或缺的一部分。语音助手除了以最常见的音箱型态出现在用户家中之外，也开始出现在像是车上的车娱系统、智能手表之中。与家中场景不同，以车载场景为例，用户在车内会有停车、行驶等状态，对于其他信息源的接收与专注程度也不同。但在现有技术中，表现为车娱系统、智能手表和智能音箱在内的语音助手针对用户在各种场景中的交互仍然会给出相同的回复，无法很好地应对各种场景下默认的关注度需求。
[0003]有鉴于此，需要一种能够应对各种场景提供恰当回复的语音交互方案。

技术实现思路

[0004]为了解决如上至少一个问题，本专利技术提出了一种能够依据场景信息裁减或是扩充语音助手交互形式与内容的方法与系统，以给予用户更友好、安全的体验。
[0005]根据本专利技术的第一方面，提出了一种语音处理方法，包括：接收语音数据；对所述语音数据进行处理；以及基于场景信息，生成所述语音数据的处理结果。由此，能够为用户提供更符合当前需要的处理结果。
[0006]可选地，可以基于不同的场景信息，生成所述语音数据的不同的处理结果，例如，生成与所述场景信息相对应的交互等级下的处理结果。不同的交互等级可以对应于如下至少一项：包括不同信息量的处理结果；包括不同交互方式的处理结果；以及包括不同交...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，包括：接收语音数据；对所述语音数据进行处理；以及基于场景信息，生成所述语音数据的处理结果。2.如权利要求1所述的方法，其中，基于场景信息，生成所述语音数据的处理结果包括：基于不同的场景信息，生成所述语音数据的不同的处理结果。3.如权利要求2所述的方法，其中，所述基于场景信息，生成所述语音数据的处理结果包括：生成与所述场景信息相对应的交互等级下的处理结果。4.如权利要求3所述的方法，其中，不同的交互等级对应于如下至少一项：包括不同信息量的处理结果；包括不同交互方式的处理结果；以及包括不同交互能力的处理结果。5.如权利要求4所述的方法，其中，所述场景信息表征用户的当前关注度级别，并且生成与所述场景信息相对应的交互等级的处理结果包括：生成包括与所述用户的当前关注度级别相对应的信息量的处理结果。6.如权利要求3所述的方法，其中，所述对所述语音数据进行处理包括：识别所述语音数据的意图和领域；以及基于所述领域的交互等级规则，选择与所述场景信息相匹配的交互等级标签。7.如权利要求6所述的方法，其中，所述生成与所述场景信息相对应的交互等级的处理结果包括：将所述意图和所述交互等级标签提交至对应领域的服务器；以及所述服务器根据所述意图和所述交互等级标签返回相应的处理结果。8.如权利要求2所述的方法，还包括：基于至少一个相关信息，确定所述场景信息。9.如权利要求8所述的方法，其中，基于至少一个相关信息，确定所述场景信息包括：至少基于所述语音交互设备类型和当前速度，确定所述场景信息是车内场景信息。10.如权利要求8所述的方法，其中，基于至少一个相关信息，确定所述场景信息包括：至少基于所述语音交互设备类型和当前时间，确定所述场景信息是室内场景信息。11.如权利要求8所述的方法，其中，基于至少一个相关信息，确定所述场景信息包括：基于当前日历信息，确定所述场景信息包括特殊日历场景信息。12.如权利要求8所述的方法，其中，基于至少一个相关信息，确定所述场景信息包括：基于当前用户信息，确定所述场景信息包括用户偏好场景信息。13.如权利要求8所述的方法，其中，所述相关信息包括如下至少一项：语音交互设备类型；当前时间；当前地理位置；当前速度；以及当前环境信息。
14.如权利要求1所述的方法，其中，所述接收语音数据包括：语音交互设备接收来自用户的语音数据；以及所述设备将所述语音数据和至少部分场景信息上传至服务器。15.如权利要求14所述的方法，其中，所述基于场景信息，生成所述语音数据的处理结果包括：所述处理器生成并下发与所述场景信息相对应的交互等级下的处理结果。16.如权利要求15所述的方法，还包括：所述语音交互设备基于下发的所述处理结果，与用户交互。17.一种分布式语音处理系统，包括服务器以及多个语音交互设备，其中：所述语音交互设备用于：获取语音数据；获取至少部分场景信息；以及将获取到的语音数据和至少部分场景信息上传至所述服务器，所述服务器用于：对所述语音数据进行处理；以及基于场景信息，生成并下发所述语音数据的处理结果，并且所述语音交互设备进一步用于：基于下发的所述处理结果，与用户交互。18.如权利要求17所述的系统，其中，所述服务器进一步用于：基于不同的场景信息，生成所述语音数据的不同的处理结果；以及生成与所述场景信息相对应的交互等级下的处理结果。19.如权利要求18所述的系统，其中，不同的交互等级对应于如下至少一项：包括不同信息量的处理结果；包括不同交互方式的处理结果；以及...

【专利技术属性】
技术研发人员：林世鹏，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人