一种基于动作引擎的语音交互方法、系统及存储介质技术方案

技术编号：30427933 阅读：38 留言：0更新日期：2021-10-24 17:15

本发明专利技术涉及语音交互技术领域，提供一种基于动作引擎的语音交互方法、系统及存储介质，从动作引擎的驱动基础上着手，先根据用户的语音指令确定其目标动作，并在设置本地仲裁规则判断目标动作的技能属性，从而通过确定目标动作是否适用当前界面，来进一步的判断用户意图，进而控制根据技能属性响应目标动作。如此，使得用户可以借由语音指令在任何界面完成对应的实用操作，实现全局所见即可说、可说即可实现的语音交互控制，大幅度地扩大了设备可识别的语音指令集；另外，从动作引擎上响应目标动作，无需额外增加第三方应用适配，降低了设备的开发成本，提高了语音交互的可移植性与兼容性。容性。容性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于动作引擎的语音交互方法、系统及存储介质

[0001]本专利技术涉及语音交互
，尤其涉及一种基于动作引擎的语音交互方法、系统及存储介质。

技术介绍

[0002]目前的语音功能交互是基于预先设计好的场景和语法，也就是说某个应用对应的语音指令是相对固定的。同时语音指令和界面存在分离现象，语音指令无法跟随界面变化，缺乏沉浸式体验。不管是离线还是云端语义识别，用户能说的指令都是预先训练好，然后通过语音识别模块进行匹配。这种模式下，用户是有一定学习成本，需要了解哪些指令是支持的，要按什么语法来说。如果用户在界面获取到信息并想当然地发出语音指令，通常得到的回复是“对不起，我没听懂”、“暂不支持改功能”等回复，用户体验差。而扩展不支持的指令，需要通过更新版本来修复，代价较大。
[0003]同时，由于功能代码是提前预置的，支持该功能的应用也相对固定，需要提前适配好。如果是从市场下载的第三方应用，基本是不支持任何指令的。在这种模式下，语音功能的兼容性和扩展性很差。例如：用户设备上预置了QQ音乐，所有音乐控制是通过QQ音乐的定制接口实现的。如果用户不喜欢QQ音乐的体验，换成网易云音乐，这时之前的音乐控制接口会全部失效，相当于功能缺失。
[0004]即，现有的语音交互方法存在以下问题：
[0005]1)语音指令固定，指令和界面分离，用户体验感较差；
[0006]2)语音功能对应的应用需要提前适配，对非预置的第三方应用基本不支持，兼容性和扩展性差。

技术实现思路

[0007]本专利...

【技术保护点】

【技术特征摘要】
1.一种基于动作引擎的语音交互方法，其特征在于，包括步骤：S1、获取用户的语音指令；S2、识别所述语音指令，确定对应的目标动作；S3、获取并识别当前界面，根据本地仲裁规则和当前界面，判断所述目标动作的技能属性；S4、控制动作引擎根据所述技能属性响应所述目标动作。2.如权利要求1所述的一种基于动作引擎的语音交互方法，其特征在于，所述步骤S1包括：S11、获取唤醒指令唤醒语音交互模块；S12、获取用户发出的语音指令并输出至语音交互模块。3.如权利要求1所述的一种基于动作引擎的语音交互方法，其特征在于，所述步骤S2包括：S21、识别所述语音指令得到语音文本；S22、解析所述语音文本，确认用户意图并确定对应的目标动作。4.如权利要求3所述的一种基于动作引擎的语音交互方法，其特征在于，所述步骤S3包括：S31、获取语音识别前的应用界面标记为当前界面；S32、识别所述当前界面确定其对应的应用界面，根据本地仲裁规则判断所述目标动作是否属于所述应用界面的可操作动作，若是则进入步骤S4，若否则判断为其它场景动作。5.如权利要求4所述的一种基于动作引擎的语音交互方法，其特征在于，在所述步骤S32中，所述本地仲裁规则具体为：根据所述目标动作对应的用户意图，在界面操控类中进行控件定位，若定位到适配的目标界面控件，则判断所述目标动作属于所述应用界面的可操作动作，否则判断为其它场景动作。6.如权利要求1所述的一种基于动作引擎的语音交互方法，其特征在于，所述步骤S4包括：S41、根据所述目标动作在界面操控类中匹配对应的目标界面控件、解析得到对应的操控意图；S42、根据...

【专利技术属性】
技术研发人员：朱渊，谢志华，王斌，何川延，银建军，王武斌，
申请(专利权)人：惠州市德赛西威汽车电子股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人