本申请公开了一种基于语音控制的智慧大屏页面切换方法和装置,其中,该方法包括:获取指令语音,并将指令语音输入至深度可分离卷积模型,输出音频特征信息,然后根据音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息,再根据隐层序列信息,通过稀疏注意力解码器模型,获取目标指令,最后根据目标指令,通过界面切换模块进行页面切换。本申请可以通过指令语音实现页面切换,能够扩展页面切换方式,提高页面切换效率。提高页面切换效率。提高页面切换效率。
【技术实现步骤摘要】
基于语音控制的智慧大屏页面切换方法和装置
[0001]本申请涉及自然语言处理领域,尤其涉及一种基于语音控制的智慧大屏页面切换方法和装置。
技术介绍
[0002]随着自动语音识别及自然语言处理技术的发展,越来越多的语音辅助类软件开始出现,例如苹果手机的siri,微软的小冰等语音助手。语音助手的功能也由最初简单的对话,开始结合终端设备功能向用户提供更多的帮助,例如可通过语音助手打开某个手机应用软件、查看天气、播放歌曲等。
[0003]一种常见的语音助手实现方式是通过记录应用软件的用户界面布局,通过把语音命令转换为模拟手势,模拟用户手势操作,以对指定控件进行操作。
[0004]但应用软件的布局可能发生变化,由于语音控制定位是根据应用软件布局确定的,如果不及时更新应用软件布局与语音操作信息的对应关系,则会发生误操作。且不同的应用软件都需要单独定制相关的模拟手势操作方式,逐个应用软件定制模拟手势会造成系统资源消耗过大。
[0005]部分应用软件也会对外提供特殊接口供语音助手调用,这样通过语音助手即可调用该应用软件的语音支持组件,实现通过语音控制该应用软件。但上述方案需要应用软件向语音助手定制接口,这样应用软件会增加额外的工作量,运算压力大;如应用软件只是提供部分主要功能的接口,则会导致语音助手对应用软件的操作能力受限。且不是所有应用软件都会提供接口,同样导致可用语音助手操作的应用软件数量较少。
技术实现思路
[0006]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0007]为此,本申请的目的在于解决语音控制页面切换的技术问题,提出了一种基于语音控制的智慧大屏页面切换的方法。
[0008]本申请的另一个目的在于提出基于语音控制的智慧大屏页面切换装置。
[0009]为达上述目的,本申请一方面提出了基于语音控制的智慧大屏页面切换方法,包括:
[0010]获取指令语音,并将所述指令语音输入至深度可分离卷积模型,输出音频特征信息;
[0011]根据所述音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息;
[0012]根据所述隐层序列信息,通过稀疏注意力解码器模型,获取目标指令;
[0013]根据所述目标指令,通过界面切换模块进行页面切换。
[0014]在一种可能的实施方式中,所述获取指令语音,并将所述指令语音输入至深度可分离卷积模型,输出音频特征信息,包括:
[0015]将所述指令语音输入至所述深度可分离卷积模型的卷积层,输出语音特征图;
[0016]将所述语音特征图输入至所述深度可分离卷积模型的池化层,输出所述音频特征信息。
[0017]在一种可能的实施方式中,所述根据所述音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息,包括:
[0018]将所述音频特征信息输入至第一前馈神经网络,获取第一归一化特征信息;
[0019]将所述第一归一化特征信息输入至多头自注意力结构编码器,获取第二归一化特征信息;
[0020]将所述第二归一化特征信息输入至第二前馈神经网络,获取所述隐层序列信息。
[0021]在一种可能的实施方式中,所述根据所述目标指令,通过界面切换模块进行页面切换,包括:
[0022]确定页面对应的索引关键字;
[0023]将所述索引关键字和所述目标指令进行匹配,其中,所述目标指令中包括目标页面的所述索引关键字;
[0024]在匹配成功的情况下,根据所述目标指令,对所述目标页面进行切换。
[0025]在一种可能的实施方式中,所述确定页面对应的索引关键字,包括:
[0026]遍历用户界面,获取至少一个可操作页面;
[0027]生成所述至少一个可操作页面的所述索引关键字。
[0028]为达到上述目的,本申请另一方面提出了一种基于语音控制的智慧大屏页面切换装置,包括:
[0029]输出模块,用于获取指令语音,并将所述指令语音输入至深度可分离卷积模型,输出音频特征信息;
[0030]第一获取模块,用于根据所述音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息;
[0031]第二获取模块,用于根据所述隐层序列信息,通过稀疏注意力解码器模型,获取目标指令;
[0032]页面切换模块,用于根据所述目标指令,通过界面切换模块进行页面切换。
[0033]在一种可能的实施方式中,所述输出模块,包括:
[0034]第一输出单元,用于将所述指令语音输入至所述深度可分离卷积模型的卷积层,输出语音特征图;
[0035]第二输出单元,用于将所述语音特征图输入至所述深度可分离卷积模型的池化层,输出所述音频特征信息。
[0036]在一种可能的实施方式中,所述第一获取模块,包括:
[0037]第一获取单元,用于将所述音频特征信息输入至第一前馈神经网络,获取第一归一化特征信息;
[0038]第二获取单元,用于将所述第一归一化特征信息输入至多头自注意力结构编码器,获取第二归一化特征信息;
[0039]第三获取单元,用于将所述第二归一化特征信息输入至第二前馈神经网络,获取所述隐层序列信息。
[0040]在一种可能的实施方式中,所述页面切换模块,包括:
[0041]确定单元,用于确定页面对应的索引关键字;
[0042]匹配单元,用于将所述索引关键字和所述目标指令进行匹配,其中,所述目标指令中包括目标页面的所述索引关键字;
[0043]切换单元,用于在匹配成功的情况下,根据所述目标指令,对所述目标页面进行切换。
[0044]在一种可能的实施方式中,所述确定单元,包括:
[0045]遍历子单元,用于遍历用户界面,获取至少一个可操作页面;
[0046]生成子单元,用于生成所述至少一个可操作页面的所述索引关键字。
[0047]本申请的有益效果:
[0048]在本申请实施例中,通过获取指令语音,并将指令语音输入至深度可分离卷积模型,输出音频特征信息,然后根据音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息,再根据隐层序列信息,通过稀疏注意力解码器模型,获取目标指令,最后根据目标指令,通过界面切换模块进行页面切换。本申请可以通过指令语音实现页面切换,能够扩展页面切换方式,提高页面切换效率。
[0049]本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
[0050]本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0051]图1为根据本申请实施例的基于语音控制的智慧大屏页面切换方法的流程图;
[0052]图2为根据本申请实施例的基于语音控制的智慧大屏页面切换装置的结构示意图。
具体实施方式
[0053]需要说明的是,在不本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于语音控制的智慧大屏页面切换方法,其特征在于,包括:获取指令语音,并将所述指令语音输入至深度可分离卷积模型,输出音频特征信息;根据所述音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息;根据所述隐层序列信息,通过稀疏注意力解码器模型,获取目标指令;根据所述目标指令,通过界面切换模块进行页面切换。2.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法,其特征在于,所述获取指令语音,并将所述指令语音输入至深度可分离卷积模型,输出音频特征信息,包括:将所述指令语音输入至所述深度可分离卷积模型的卷积层,输出语音特征图;将所述语音特征图输入至所述深度可分离卷积模型的池化层,输出所述音频特征信息。3.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法,其特征在于,所述根据所述音频特征信息,通过双半步剩余权重前馈神经网络,获取隐层序列信息,包括:将所述音频特征信息输入至第一前馈神经网络,获取第一归一化特征信息;将所述第一归一化特征信息输入至多头自注意力结构编码器,获取第二归一化特征信息;将所述第二归一化特征信息输入至第二前馈神经网络,获取所述隐层序列信息。4.根据权利要求1所述的基于语音控制的智慧大屏页面切换方法,其特征在于,所述根据所述目标指令,通过界面切换模块进行页面切换,包括:确定页面对应的索引关键字;将所述索引关键字和所述目标指令进行匹配,其中,所述目标指令中包括目标页面的所述索引关键字;在匹配成功的情况下,根据所述目标指令,对所述目标页面进行切换。5.根据权利要求4所述的基于语音控制的智慧大屏页面切换方法,其特征在于,所述确定页面对应的索引关键字,包括:遍历用户界面,获取至少一个可操作页面;生成所述至少一个可操作页面的所述索引关键字。6.一种基于语音控制的智慧大屏页面切换装置,...
【专利技术属性】
技术研发人员:沈凯,张聪尧,王妙云,许洁,李健,
申请(专利权)人:中煤科工集团信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。