语音交互方法、设备及存储介质技术

技术编号：44567508 阅读：22 留言：0更新日期：2025-03-11 14:25

本申请公开了一种语音交互方法、设备及存储介质，涉及人工智能技术领域，所述的方法包括：获取用户的目标语音指令，并根据预设的目标大语言模型对所述目标语音指令进行解析，得到控制意图；根据所述控制意图和被控设备对应的UI界面，确定所述控制意图对应的目标界面元素的位置序列；以及根据所述控制意图确定触发动作序列；控制所述被控设备基于所述位置序列和所述触发动作序列响应所述目标语音指令，其中，所述位置序列和所述触发动作序列的组成元素量相等。本申请能够根据用户输入的语音指令自动完成和用户界面的交互，提高了交互的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种语音交互方法、设备及存储介质。

技术介绍

1、随着移动互联网和物联网技术的发展，用户与移动类设备(如手机、平板等运行在android、ios、linux、windows、sailfish及其他操作系统上的设备)以及新零售设备(如自动售卖机)的交互越来越频繁。为了提高用户体验和自动化水平，通过语音指令来实现用户操作的模拟的方式越来越常见。

2、目前，通常将用户语音指令与特定的设备操作或应用程序功能进行绑定。在脚本中通过硬编码的方式指定了用户语音指令所对应的设备操作位置信息(如按钮位置、文本框位置等)。当设备接收到用户语音指令时，脚本会解析指令并根据预设的位置信息模拟用户进行相应的操作。然而，硬编码的位置信息往往依赖于特定的设备和应用程序版本，当设备或应用程序发生更新时，原本硬编码的位置信息可能会发生变化，导致硬编码脚本失效，无法准确模拟用户操作。

3、上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

>1、本申请的主要目本文档来自技高网...

【技术保护点】

1.一种语音交互方法，其特征在于，所述的方法包括：

2.如权利要求1所述的方法，其特征在于，所述获取用户的目标语音指令，并根据预设的目标大语言模型对所述目标语音指令进行解析，以得到控制意图的步骤包括：

3.如权利要求2所述的方法，其特征在于，所述根据所述意图分布中的概率信息和预设的意图标签进行匹配，并根据匹配结果确定所述控制意图的步骤包括：

4.如权利要求1所述的方法，其特征在于，在所述获取用户的目标语音指令，并根据预设的目标大语言模型对所述目标语音指令进行解析，以得到控制意图的步骤之前包括：

5.如权利要求1所述的方法，其特征在于，在所述...

【技术特征摘要】

1.一种语音交互方法，其特征在于，所述的方法包括：

5.如权利要求1所述的方法，其特征在于，在所述获取用户的目标语音指令，并根据预设的目标大语言模型对所述目标语音指令进行解析，以得到控制意图的步骤之前还包括：

6.如权利要求1所述的方法，其特征在于，所述根据所述控制...

【专利技术属性】
技术研发人员：李山，郭湘南，杜荔枝，
申请(专利权)人：深圳市三兔科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人