基于语音的交互方法、装置、智能设备和计算机可读存储介质制造方法及图纸

技术编号：34421770 阅读：16 留言：0更新日期：2022-08-06 15:47

本发明专利技术的实施例提供了一种基于语音的交互方法、装置、智能设备和计算机可读存储介质，涉及智能交互技术领域，方法包括：接收所处家居空间的声音数据，获得与声音数据对应的家居场景类型，当获得交互指示时，通过与家居场景类型对应的语音预测策略生成预测声学特征，对预测声学特征进行合成，获得与交互指示对应的输出响应语音数据，从而提高了输出响应语音数据的适配度。据的适配度。据的适配度。

全部详细技术资料下载

【技术实现步骤摘要】
基于语音的交互方法、装置、智能设备和计算机可读存储介质

[0001]本专利技术涉及智能交互
，具体而言，涉及一种基于语音的交互方法、装置、智能设备和计算机可读存储介质。

技术介绍

[0002]现有的智能家居场景中，智能设备在与用户进行语音交互过程中需要进行语音合成并将合成的语音进行播报，经研究发现，现今智能设备所播报的语音的适配度有待提高。

技术实现思路

[0003]法国耳鼻喉科医生爱蒂安
·
伦巴德于1909年经研究发现，在有噪声环境下进行交流的时候，说话人不得不主动改变发声方式，提高声音的效果，希望使对方能听清。经研究发现，即使同一个人发相同的语音，在不同环境下的语音特征也有所不同，改变的特征包括提高声音的音高、音调、响度及共振峰特征等。这种现象称为Lombard effect(伦巴德效应)。有鉴于此，专利技术人对如何提高智能设备在嘈杂声学环境所播报语音的清晰度进行了研究，进而提出一种智能设备通过“模仿”(即：应用)人类在Lombard effect下主动改变发声方式的这种变化，使得在家居场景类型为嘈杂类型时，合成具有对应场景声学风格的语音数据进行播报，通过合成具备更好辨识度、自然度和可懂度的语音，我们在此称为Lombard speech(伦巴德语音)，以确保在嘈杂家居环境下与用户语音交互的顺畅度。
[0004]本专利技术的目的之一包括，例如，提供了一种基于语音的交互方法、装置、智能设备和计算机可读存储介质，以至少部分地提高输出响应语音数据的适配度。
[000...

【技术保护点】

【技术特征摘要】
1.一种基于语音的交互方法，应用于智能设备，其特征在于，所述方法包括：接收所处家居空间的声音数据；获得与所述声音数据对应的家居场景类型；当获得交互指示时，通过与所述家居场景类型对应的语音预测策略生成预测声学特征；对所述预测声学特征进行合成，获得与所述交互指示对应的输出响应语音数据。2.根据权利要求1所述的基于语音的交互方法，其特征在于，所述通过与所述家居场景类型对应的语音预测策略生成预测声学特征的步骤，包括：当所述家居场景类型为安静类型时，根据响应文本内容信息确定与所述安静类型对应的第一预测声学特征。3.根据权利要求1所述的基于语音的交互方法，其特征在于，所述通过与所述家居场景类型对应的语音预测策略生成预测声学特征的步骤，包括：当所述家居场景类型为嘈杂类型时，确定该嘈杂类型对应的场景风格嵌入信息；其中，所述场景风格嵌入信息表征与嘈杂家居场景对应的场景声学风格；根据响应文本内容信息与所述场景风格嵌入信息确定与所述嘈杂类型对应的第二预测声学特征。4.根据权利要求1所述的基于语音的交互方法，其特征在于，还包括：当所述智能设备处于初始状态时，获得所述智能设备所处家居空间的声源类型；所述声源类型表征所处家居空间中包含的声源对应的声学特征；根据所述声源类型确定所述家居场景类型。5.根据权利要求1所述的基于语音的交互方法，其特征在于，还包括：接收用户配置的语音预测策略，所述语音预测策略包含嘈杂类型对应的场景风格嵌入信息；其中，所述场景风格嵌入信息表征与家居场景对应的场景声学风格；所述通过与所述家居场景类型对应的语音预测策略生成预测声学特征的步骤，包括：根据响应文本内容信息与所述场景风格嵌入信息确定与所述嘈...

【专利技术属性】
技术研发人员：高羽，
申请(专利权)人：美的集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人