一种多终端智能语音协调交互方法及系统技术方案

技术编号：46062683 阅读：11 留言：0更新日期：2025-08-11 15:48

本发明专利技术公开了一种多终端智能语音协调交互方法及系统，包括：采集语音数据，对所述语音数据进行预处理，并基于注意力机制的语音识别模型进行语音识别；对语音识别的结果进行意图识别样本处理，并基于意图识别模型进行意图识别；根据识别的意图生成语音响应内容，并通过自定义的语音助手的虚拟形象进行语音响应；基于多终端适配机制和资源调配机制进行多终端适配和跨设备协同处理，将语音交互内容以及虚拟形象的语音响应进行同步与反馈。本发明专利技术提升了语音识别、语义理解、个性化服务及多终端协同的整体能力，为用户提供了高效、自然、智能化的语音交互体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音处理，尤其涉及的是一种多终端智能语音协调交互方法及系统。

技术介绍

1、随着人工智能和语音交互技术的快速发展，使用智能语音系统逐渐成为各行业向智能化转型的重要战略方向。无论是在智能电视、智能车载、还是智能音响等设备场景中，语音交互都是连接用户与设备之间信息交换的一种重要交互方式。然而，现有的智能语音系统在语音识别能力、个性化定制、多终端协同等方面仍存在诸多技术挑战和局限，导致其无法完全满足用户对高效、灵活和智能语音交互的需求。

2、1、语音识别与语义理解能力不足：尽管语音识别和自然语言理解技术已取得一定进展，但在面对复杂的真实环境和多轮对话场景下，现有系统的语音识别精度和语义理解能力仍有局限，时常无法为用户提供高效、满意的交互体验。

3、2、个性化与定制化不足：现有智能语音系统往往以单一的标准化语音服务为主，缺乏根据用户需求、场景、设备类型等进行个性化定制的能力，无法充分满足用户创建个性化和定制化产品的需求。

4、3、多终端协同性差：市面中已有的智能语音产品相互之间的协同和互操作性较...

【技术保护点】

1.一种多终端智能语音协调交互方法，其特征在于，包括：

2.根据权利要求1所述的多终端智能语音协调交互方法，其特征在于，所述采集语音数据，对所述语音数据进行预处理，并基于注意力机制的语音识别模型进行语音识别，包括：

3.根据权利要求2所述的多终端智能语音协调交互方法，其特征在于，所述基于所述注意力机制的语音识别模型对所述预处理后的语音数据进行语音识别，得到语音识别的文本结果，之前包括：

4.根据权利要求1所述的多终端智能语音协调交互方法，其特征在于，所述对语音识别的结果进行意图识别样本处理，并基于意图识别模型进行意图识别，包括：p>

5.根据权...

【技术特征摘要】

1.一种多终端智能语音协调交互方法，其特征在于，包括：

4.根据权利要求1所述的多终端智能语音协调交互方法，其特征在于，所述对语音识别的结果进行意图识别样本处理，并基于意图识别模型进行意图识别，包括：

5.根据权利要求1所述的多终端智能语音协调交互方法，其特征在于，所述根据识别的意图生成语音响应内容，并通过自定义的语音助手的虚拟形象进行语音响应，包括：

6.根据权利要求5所述的多终端智能语音协调交互方法，其特...

【专利技术属性】
技术研发人员：王欣然，宋泳祥，余海超，张起凡，
申请(专利权)人：深圳市酷开网络科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人