基于语音控制的智慧大屏页面切换方法和装置制造方法及图纸

技术编号：37854585 阅读：34 留言：0更新日期：2023-06-14 22:47

本申请公开了一种基于语音控制的智慧大屏页面切换方法和装置，其中，该方法包括：获取指令语音，并将指令语音输入至深度可分离卷积模型，输出音频特征信息，然后根据音频特征信息，通过双半步剩余权重前馈神经网络，获取隐层序列信息，再根据隐层序列信息，通过稀疏注意力解码器模型，获取目标指令，最后根据目标指令，通过界面切换模块进行页面切换。本申请可以通过指令语音实现页面切换，能够扩展页面切换方式，提高页面切换效率。提高页面切换效率。提高页面切换效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于语音控制的智慧大屏页面切换方法和装置

[0001]本申请涉及自然语言处理领域，尤其涉及一种基于语音控制的智慧大屏页面切换方法和装置。

技术介绍

[0002]随着自动语音识别及自然语言处理技术的发展，越来越多的语音辅助类软件开始出现，例如苹果手机的siri，微软的小冰等语音助手。语音助手的功能也由最初简单的对话，开始结合终端设备功能向用户提供更多的帮助，例如可通过语音助手打开某个手机应用软件、查看天气、播放歌曲等。
[0003]一种常见的语音助手实现方式是通过记录应用软件的用户界面布局，通过把语音命令转换为模拟手势，模拟用户手势操作，以对指定控件进行操作。
[0004]但应用软件的布局可能发生变化，由于语音控制定位是根据应用软件布局确定的，如果不及时更新应用软件布局与语音操作信息的对应关系，则会发生误操作。且不同的应用软件都需要单独定制相关的模拟手势操作方式，逐个应用软件定制模拟手势会造成系统资源消耗过大。
[0005]部分应用软件也会对外提供特殊接口供语音助手调用，这样通过语音助手即可调用该应用软...

【技术保护点】

【技术特征摘要】
1.一种基于语音控制的智慧大屏页面切换方法，其特征在于，包括：获取指令语音，并将所述指令语音输入至深度可分离卷积模型，输出音频特征信息；根据所述音频特征信息，通过双半步剩余权重前馈神经网络，获取隐层序列信息；根据所述隐层序列信息，通过稀疏注意力解码器模型，获取目标指令；根据所述目标指令，通过界面切换模块进行页面切换。2.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法，其特征在于，所述获取指令语音，并将所述指令语音输入至深度可分离卷积模型，输出音频特征信息，包括：将所述指令语音输入至所述深度可分离卷积模型的卷积层，输出语音特征图；将所述语音特征图输入至所述深度可分离卷积模型的池化层，输出所述音频特征信息。3.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法，其特征在于，所述根据所述音频特征信息，通过双半步剩余权重前馈神经网络，获取隐层序列信息，包括：将所述音频特征信息输入至第一前馈神经网络，获取第一归一化特征信息；将所述第一归一化特征信息输入至多头自注意力结构编码器，获取第二归一化特征信息；将所述第二归一化特征信息输入至第二前馈神经网络，获取所述隐层序列信息。4.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法，其特征在于，所述根据所述目标指令，通过界面切换模块进行页面切换，包括：确定页面对应的索引关键字；将所述索引关键字和所述目标指令进行匹配，其中，所述目标指令中包括目标页面的所述索引关键字；在匹配成功的情况下，根据所述目标指令，对所述目标页面进行切换。5.根据权利要求4所述的基于语音控制的智慧大屏页面切换方法，其特征在于，所述确定页面对应的索引关键字，包括：遍历用户界面，获取至少一个可操作页面；生成所述至少一个可操作页面的所述索引关键字。6.一种基于语音控制的智慧大屏页面切换装置，...

【专利技术属性】
技术研发人员：沈凯，张聪尧，王妙云，许洁，李健，
申请(专利权)人：中煤科工集团信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人