语音处理方法和分布式系统、及语音交互设备和方法技术方案

技术编号:28050520 阅读:23 留言:0更新日期:2021-04-14 13:08
提出了一种语音处理方法和分布式系统、及语音交互设备和方法,其中该语音处理方法包括:接收语音数据;对所述语音数据进行处理;以及基于场景信息,生成所述语音数据的处理结果。由此,能够为用户提供更符合当前需要的处理结果。本发明专利技术的语音处理方案可以通过对场景信息的获取和判断推测出用户的当前关注度水平,并且给出与用户的所述关注度水平相适应的反馈内容。进一步地,该方案还可以根据关注度水平和当前语音设备的交互条件,确定交互的具体形式,由此灵活应对不同的应用场景,并提供各自最优的使用体验。各自最优的使用体验。各自最优的使用体验。

【技术实现步骤摘要】
语音处理方法和分布式系统、及语音交互设备和方法


[0001]本专利技术涉及信息处理领域,尤其涉及一种语言处理方法和分布式系统, 以及语音交互设备和方法。

技术介绍

[0002]智能语音助手已逐渐普及,成为许多用户生活中不可或缺的一部分。 语音助手除了以最常见的音箱型态出现在用户家中之外,也开始出现在像 是车上的车娱系统、智能手表之中。与家中场景不同,以车载场景为例, 用户在车内会有停车、行驶等状态,对于其他信息源的接收与专注程度也 不同。但在现有技术中,表现为车娱系统、智能手表和智能音箱在内的语 音助手针对用户在各种场景中的交互仍然会给出相同的回复,无法很好地 应对各种场景下默认的关注度需求。
[0003]有鉴于此,需要一种能够应对各种场景提供恰当回复的语音交互方案。

技术实现思路

[0004]为了解决如上至少一个问题,本专利技术提出了一种能够依据场景信息裁 减或是扩充语音助手交互形式与内容的方法与系统,以给予用户更友好、 安全的体验。
[0005]根据本专利技术的第一方面,提出了一种语音处理方法,包括:接收语音 数据;对所述语音数据进行处理;以及基于场景信息,生成所述语音数据 的处理结果。由此,能够为用户提供更符合当前需要的处理结果。
[0006]可选地,可以基于不同的场景信息,生成所述语音数据的不同的处理 结果,例如,生成与所述场景信息相对应的交互等级下的处理结果。不同 的交互等级可以对应于如下至少一项:包括不同信息量的处理结果;包括 不同交互方式的处理结果;以及包括不同交互能力的处理结果。
[0007]可选地,所述场景信息可以表征用户的当前关注度级别,并且生成与 所述场景信息相对应的交互等级的处理结果包括:生成包括与所述用户的 当前关注度级别相对应的信息量的处理结果。
[0008]可选地,该方法还可以包括:基于至少一个相关信息,确定所述场景 信息。具体地,可以至少基于所述语音交互设备类型和当前速度,确定所 述场景信息是车内场景信息;可以至少基于所述语音交互设备类型和当前 时间,确定所述场景信息是室内场景信息;可以基于当前日历信息,确定 所述场景信息包括特殊日历场景信息;可以基于当前用户信息,确定所述 场景信息包括用户偏好场景信息。所述相关信息可以包括如下至少一项: 语音交互设备类型;当前时间;当前地理位置;当前速度;当前日历信息; 用户偏好信息;以及当前环境信息。
[0009]可选地,所述对所述语音数据进行处理包括:识别所述语音数据的意 图和领域;以及基于所述领域的交互等级规则,选择与所述场景信息相匹 配的交互等级标签。于是,生成与所述场景信息相对应的交互等级的处理 结果可以包括:将所述意图和所述交互等
级标签提交至对应领域的服务器; 以及所述服务器根据所述意图和所述交互等级标签返回相应的处理结果。
[0010]可选地,接收语音数据可以包括:语音交互设备接收来自用户的语音 数据;以及所述设备将所述语音数据和至少部分场景信息上传至服务器。 相应地,所述基于场景信息,生成所述语音数据的处理结果可以包括:所 述处理器生成并下发与所述场景信息相对应的交互等级下的处理结果。进 一步地,该方法还可以包括:所述语音交互设备基于下发的所述处理结果, 与用户交互。
[0011]根据本专利技术的第二方面,提出了一种分布式语音处理系统,包括服务 器以及多个语音交互设备,其中:所述语音交互设备用于:获取语音数据; 获取至少部分场景信息;以及将获取到的语音数据和至少部分场景信息上 传至所述服务器,所述服务器用于:对所述语音数据进行处理;以及基于 场景信息,生成并下发所述语音数据的处理结果,并且所述语音交互设备 进一步用于:基于下发的所述处理结果,与用户交互。
[0012]根据本专利技术的第三方面,提出了一种语音交互设备,包括:语音数据 接收装置,用于获取语音数据;场景信息获取装置,用于获取至少部分场 景信息;联网装置,用于将获取到的语音数据和至少部分场景信息上传至 所述服务器,并获取所述服务器基于场景信息生成并下发所述语音数据的 处理结果;交互装置,用于基于下发的所述处理结果进行交互。
[0013]根据本专利技术的第四方面,提出了一种语音交互方法,包括:获取语音 数据;获取至少部分场景信息;将获取到的语音数据和至少部分场景信息 上传至服务器,获取所述服务器基于场景信息生成并下发所述语音数据的 处理结果;以及基于下发的所述处理结果进行交互。
[0014]根据本专利技术的第五方面,提出了一种计算设备,包括:处理器;以及 存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时, 使所述处理器执行如上任一项所述的方法。
[0015]根据本专利技术的第六方面,提出了一种非暂时性机器可读存储介质,其 上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使 所述处理器执行如上任一项所述的方法。
[0016]本专利技术的语音处理方案可以通过对场景信息的获取和判断推测出用 户的当前关注度水平,并且给出与用户的所述关注度水平相适应的反馈内 容。进一步地,该方案还可以根据关注度水平和当前语音设备的交互条件, 确定交互的具体形式,由此灵活应对不同的应用场景,并提供各自最优的 使用体验。
附图说明
[0017]通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的 上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性 实施方式中,相同的参考标号通常代表相同部件。
[0018]图1示出了根据本专利技术一个实施例的语音处理方法的流程示意图。
[0019]图2示出了语音交互链路的处理流程示意图。
[0020]图3示出了根据本专利技术一个实施例的分布式语音处理系统的组成示意 图。
[0021]图4示出了本专利技术云端语音服务系统的一个实现例。
[0022]图5示出了根据本专利技术一个实施例的语音交互设备的组成示意图。
[0023]图6示出了根据本专利技术一个实施例的语音交互方法的流程示意图。图7示出了根据本专利技术一个实施例可用于实现上述语音处理方法的计 算设备的结构示意图。图8A-D示出了根据本专利技术的语音处理方案的应用场景。
具体实施方式
[0024]下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显 示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开 而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使 本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的 技术人员。
[0025]智能语音助手已逐渐普及,成为许多用户生活中不可或缺的一部分。 语音助手除了以最常见的音箱型态出现在用户家中之外,也开始出现在像 是车上的车娱系统、智能手表之中。与家中场景不同,以车载场景为例, 用户在车内会有停止、行驶等状态,对于其他信息源的接收与专注程度也 不同。因此,语音助手所提供的能力、回复也必须依据场景有所调整,本 专利技术提供了一个能够依据场景信息裁减/扩充语音助手交互形式与内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法,包括:接收语音数据;对所述语音数据进行处理;以及基于场景信息,生成所述语音数据的处理结果。2.如权利要求1所述的方法,其中,基于场景信息,生成所述语音数据的处理结果包括:基于不同的场景信息,生成所述语音数据的不同的处理结果。3.如权利要求2所述的方法,其中,所述基于场景信息,生成所述语音数据的处理结果包括:生成与所述场景信息相对应的交互等级下的处理结果。4.如权利要求3所述的方法,其中,不同的交互等级对应于如下至少一项:包括不同信息量的处理结果;包括不同交互方式的处理结果;以及包括不同交互能力的处理结果。5.如权利要求4所述的方法,其中,所述场景信息表征用户的当前关注度级别,并且生成与所述场景信息相对应的交互等级的处理结果包括:生成包括与所述用户的当前关注度级别相对应的信息量的处理结果。6.如权利要求3所述的方法,其中,所述对所述语音数据进行处理包括:识别所述语音数据的意图和领域;以及基于所述领域的交互等级规则,选择与所述场景信息相匹配的交互等级标签。7.如权利要求6所述的方法,其中,所述生成与所述场景信息相对应的交互等级的处理结果包括:将所述意图和所述交互等级标签提交至对应领域的服务器;以及所述服务器根据所述意图和所述交互等级标签返回相应的处理结果。8.如权利要求2所述的方法,还包括:基于至少一个相关信息,确定所述场景信息。9.如权利要求8所述的方法,其中,基于至少一个相关信息,确定所述场景信息包括:至少基于所述语音交互设备类型和当前速度,确定所述场景信息是车内场景信息。10.如权利要求8所述的方法,其中,基于至少一个相关信息,确定所述场景信息包括:至少基于所述语音交互设备类型和当前时间,确定所述场景信息是室内场景信息。11.如权利要求8所述的方法,其中,基于至少一个相关信息,确定所述场景信息包括:基于当前日历信息,确定所述场景信息包括特殊日历场景信息。12.如权利要求8所述的方法,其中,基于至少一个相关信息,确定所述场景信息包括:基于当前用户信息,确定所述场景信息包括用户偏好场景信息。13.如权利要求8所述的方法,其中,所述相关信息包括如下至少一项:语音交互设备类型;当前时间;当前地理位置;当前速度;以及当前环境信息。
14.如权利要求1所述的方法,其中,所述接收语音数据包括:语音交互设备接收来自用户的语音数据;以及所述设备将所述语音数据和至少部分场景信息上传至服务器。15.如权利要求14所述的方法,其中,所述基于场景信息,生成所述语音数据的处理结果包括:所述处理器生成并下发与所述场景信息相对应的交互等级下的处理结果。16.如权利要求15所述的方法,还包括:所述语音交互设备基于下发的所述处理结果,与用户交互。17.一种分布式语音处理系统,包括服务器以及多个语音交互设备,其中:所述语音交互设备用于:获取语音数据;获取至少部分场景信息;以及将获取到的语音数据和至少部分场景信息上传至所述服务器,所述服务器用于:对所述语音数据进行处理;以及基于场景信息,生成并下发所述语音数据的处理结果,并且所述语音交互设备进一步用于:基于下发的所述处理结果,与用户交互。18.如权利要求17所述的系统,其中,所述服务器进一步用于:基于不同的场景信息,生成所述语音数据的不同的处理结果;以及生成与所述场景信息相对应的交互等级下的处理结果。19.如权利要求18所述的系统,其中,不同的交互等级对应于如下至少一项:包括不同信息量的处理结果;包括不同交互方式的处理结果;以及...

【专利技术属性】
技术研发人员:林世鹏
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1