【技术实现步骤摘要】
基于语音控制的智慧大屏页面切换方法和装置
[0001]本申请涉及自然语言处理领域,尤其涉及一种基于语音控制的智慧大屏页面切换方法和装置。
技术介绍
[0002]随着自动语音识别及自然语言处理技术的发展,越来越多的语音辅助类软件开始出现,例如苹果手机的siri,微软的小冰等语音助手。语音助手的功能也由最初简单的对话,开始结合终端设备功能向用户提供更多的帮助,例如可通过语音助手打开某个手机应用软件、查看天气、播放歌曲等。
[0003]一种常见的语音助手实现方式是通过记录应用软件的用户界面布局,通过把语音命令转换为模拟手势,模拟用户手势操作,以对指定控件进行操作。
[0004]但应用软件的布局可能发生变化,由于语音控制定位是根据应用软件布局确定的,如果不及时更新应用软件布局与语音操作信息的对应关系,则会发生误操作。且不同的应用软件都需要单独定制相关的模拟手势操作方式,逐个应用软件定制模拟手势会造成系统资源消耗过大。
[0005]部分应用软件也会对外提供特殊接口供语音助手调用,这样通过语音助手即可调用该应用软 ...
【技术保护点】
【技术特征摘要】
1.一种基于语音控制的智慧大屏页面切换方法,其特征在于,包括:获取指令语音,并将所述指令语音输入至深度可分离卷积模型,输出音频特征信息;根据所述音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息;根据所述隐层序列信息,通过稀疏注意力解码器模型,获取目标指令;根据所述目标指令,通过界面切换模块进行页面切换。2.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法,其特征在于,所述获取指令语音,并将所述指令语音输入至深度可分离卷积模型,输出音频特征信息,包括:将所述指令语音输入至所述深度可分离卷积模型的卷积层,输出语音特征图;将所述语音特征图输入至所述深度可分离卷积模型的池化层,输出所述音频特征信息。3.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法,其特征在于,所述根据所述音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息,包括:将所述音频特征信息输入至第一前馈神经网络,获取第一归一化特征信息;将所述第一归一化特征信息输入至多头自注意力结构编码器,获取第二归一化特征信息;将所述第二归一化特征信息输入至第二前馈神经网络,获取所述隐层序列信息。4.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法,其特征在于,所述根据所述目标指令,通过界面切换模块进行页面切换,包括:确定页面对应的索引关键字;将所述索引关键字和所述目标指令进行匹配,其中,所述目标指令中包括目标页面的所述索引关键字;在匹配成功的情况下,根据所述目标指令,对所述目标页面进行切换。5.根据权利要求4所述的基于语音控制的智慧大屏页面切换方法,其特征在于,所述确定页面对应的索引关键字,包括:遍历用户界面,获取至少一个可操作页面;生成所述至少一个可操作页面的所述索引关键字。6.一种基于语音控制的智慧大屏页面切换装置,...
【专利技术属性】
技术研发人员:沈凯,张聪尧,王妙云,许洁,李健,
申请(专利权)人:中煤科工集团信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。