一种语音交互方法、装置、电子设备和存储介质制造方法及图纸

技术编号：37390985 阅读：26 留言：0更新日期：2023-04-27 07:29

本发明专利技术公开了一种语音交互方法、装置、电子设备和存储介质。其中，该方法包括：根据交互操作界面的界面图片确定至少一个待交互元素，基于预设配置文件播放所述待交互元素的辅助操作语音，根据对应所述辅助操作语音的用户交互语音生成元素触发信息，根据所述元素触发信息控制所述待交互元素执行业务功能。本发明专利技术实施例通过将交互操作界面的待交互元素转换成能够以语音形式播放给用户的辅助操作语音，协助用户执行相应的业务功能，提高了语音语义识别精度以及用户的行车安全性和体验效果；同时，语音交互过程中不需要修改软件和平台即可适配大量的应用软件和各种操作系统，具有较好的通用性和可实施性，有效避免了代码入侵的风险。险。险。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音交互方法、装置、电子设备和存储介质

[0001]本专利技术涉及计算机应用
，尤其涉及一种语音交互方法、装置、电子设备和存储介质。

技术介绍

[0002]随着语音技术和汽车智能化的飞速发展，基于用户界面(User Interface，UI)的语音交互技术逐渐受到人们的青睐。在车载领域中，用户可以通过语音交互技术，无接触地实现对车辆上的车载系统或者车载系统安装的第三方应用程序的控制，并且不需要占用用户的视线，因此，研究语音交互技术对于提高驾驶安全具有重要意义。
[0003]然而，目前的语音交互方法还存在以下不足之处：
[0004]1、现有的语音交互方法中用户可能需要先看到用户界面内容，才会做出语音交互的请求，这需要短暂占用用户的视觉注意力，同时对于用户输入的语音请求可能会发生识别错误的情况，因此存在一定的安全风险以及识别精度较低的问题，进而导致用户的体验效果不佳。
[0005]2、现有的语音交互方法在接收到用户的语音请求后，需要调用相应应用程序的语音交互接口才能执行相应的操作，这种语音交互方法需要修改大量的应用程序代码甚至是操作系统，才能适配更多的应用程序，因此存在通用性和可行性较差的问题，并且可能出现代码入侵的风险。

技术实现思路

[0006]本专利技术提供了一种语音交互方法、装置、电子设备和存储介质，以实现直接从交互操作界面的界面图片去确定相应的辅助操作语音，协助用户执行相应的业务功能，提高了语音语义的识别准确性和用户的体验效果，可提升用户的行车驾驶安全；同时，在...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法，其特征在于，包括：根据交互操作界面的界面图片确定至少一个待交互元素；基于预设配置文件播放所述待交互元素的辅助操作语音；根据对应所述辅助操作语音的用户交互语音生成元素触发信息；根据所述元素触发信息控制所述待交互元素执行业务功能。2.根据权利要求1所述方法，其特征在于，所述根据交互操作界面的界面图片确定至少一个待交互元素，包括：调用预设屏幕截取程序接口截取所述交互操作界面的所述界面图片；按照预训练神经网络模型识别所述界面图片内的所述待交互元素。3.根据权利要求1或2所述方法，其特征在于，所述待交互元素包括以下至少之一：元素类型、文字描述信息、元素位置、元素显示尺寸。4.根据权利要求1所述方法，其特征在于，所述基于预设配置文件播放所述待交互元素的辅助操作语音，包括：按照所述待交互元素的元素类型在所述预设配置文件查找操作提示；生成所述操作提示以及所述待交互元素对应的所述辅助操作语音；控制预设语音播放设备播放所述辅助操作语音。5.根据权利要求4所述方法，其特征在于，所述根据对应所述辅助操作语音的用户交互语音生成元素触发信息，包括：控制预设语音采集设备接收所述用户交互语音；在所述用户交互语音内语音识别交互关键字；将与所述操作提示匹配的所述交互关键字作为所述元素触发信息。6.根据权利要求1所述方法，其特征在于，所述根据...

【专利技术属性】
技术研发人员：古幼鹏，
申请(专利权)人：惠州市德赛西威汽车电子股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人