一种语音控制方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30773131 阅读:28 留言:0更新日期:2021-11-16 07:30
本申请公开了一种语音控制方法、装置、电子设备及存储介质,涉及智能语音控制领域。其中方法包括:在带屏语音交互设备显示预设应用的页面的情况下,对接收到的语音信息进行识别,得到识别结果;根据所述识别结果生成针对所述页面的第一控制指令;采用所述第一控制指令对所述页面进行控制。本申请实施例能够简化对带屏语音交互设备的控制操作,提高用户体验。验。验。

【技术实现步骤摘要】
一种语音控制方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能领域,尤其涉及智能语音控制领域。

技术介绍

[0002]带屏语音交互设备已经出现在越来越多的家庭中,现有技术支持对一些技能的语音控制,例如查询天气、查询时间等。当开启带屏语音交互设备的一些应用例如购物类应用时,往往无法对这些应用的页面进行语音控制,而需要用户手动点击屏幕进行控制;这种控制方式不够便利,用户体验较差。

技术实现思路

[0003]本申请实施例提供一种语音控制方法、装置、电子设备及存储介质,以解决现有技术中的一个或多个技术问题。
[0004]第一方面,本申请提供一种语音控制方法,包括以下步骤:
[0005]在带屏语音交互设备显示预设应用的页面的情况下,对接收到的语音信息进行识别,得到识别结果;
[0006]根据所述识别结果生成针对所述页面的第一控制指令;
[0007]采用所述第一控制指令对所述页面进行控制。
[0008]采用上述方案,可以实现对应用程序页面的语音控制,在带屏语音交互设备开启预设应用的情况下,无需用户手动控制页面,这种控制方式更为便利,能够提高用户体验。
[0009]第二方面,本申请提供一种语音控制装置,包括:
[0010]识别模块,用于在带屏语音交互设备显示预设应用的页面的情况下,对接收到的语音信息进行识别,得到识别结果;
[0011]指令生成模块,用于根据所述识别结果生成针对所述页面的第一控制指令;
[0012]页面控制模块,用于采用所述第一控制指令对所述页面进行控制。
[0013]第三方面,本申请实施例提供一种电子设备,包括:
[0014]至少一个处理器;以及
[0015]与至少一个处理器通信连接的存储器;其中,
[0016]存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请任意一项实施例所提供的方法。
[0017]第四方面,本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本申请任意一项实施例所提供的方法。
[0018]上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
[0019]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0020]图1为根据本申请一实施例的语音控制方法的实现流程图一;
[0021]图2为根据本申请一实施例的语音控制方法中,步骤S102的一种实现流程图;
[0022]图3为根据本申请一实施例的语音控制方法的实现流程图二;
[0023]图4为根据本申请一实施例的语音控制方法的实现流程图三;
[0024]图5为根据本申请一实施例的语音控制装置的结构示意图一;
[0025]图6为根据本申请一实施例的语音控制装置的结构示意图二;
[0026]图7是用来实现本申请实施例的语音控制方法的电子设备的框图。
具体实施方式
[0027]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0028]本申请实施例提出一种语音控制方法,可以应用于带屏带屏语音交互设备,对带屏语音交互设备的显示页面或设备的硬件功能进行语音控制。图1为根据本申请一实施例的语音控制方法的实现流程图一,包括以下步骤:
[0029]S101:在带屏语音交互设备显示预设应用的页面的情况下,对接收到的语音信息进行识别,得到识别结果;
[0030]S102:根据上述识别结果生成针对上述页面的第一控制指令;
[0031]S103:采用上述第一控制指令对上述页面进行控制。
[0032]本申请实施例的上述方法可以由带屏智能语音控制设备执行或由云端服务器执行。以云端服务器执行为例,带屏智能语音控制设备在接收到语音信息后,将语音信息发送至云端服务器;由云端服务器对语音信息进行识别,得到识别结果。如果带屏语音交互设备当前正在显示预设应用的页面,则云端服务器根据该识别结果生成针对该页面的第一控制指令,并将该第一控制指令下发至带屏语音交互设备,从而实现对该页面的控制。此外,带屏语音交互设备在上报语音信息的同时,也可以同步上报用户的标识信息、用户的语音特征等信息。云端服务器可以预先存储不同用户的语音特征,在接收到用户的标识信息时,根据该标识信息查找该用户的语音特征;或者,云端服务器可以接收用户上报的语音特征。在对该用户的语音信息进行识别时,云端服务器可以参考该语音特征进行语音识别,从而得到更为准确的识别结果。
[0033]另外,对语音信息的识别结果还有可能是噪音,例如环境背景音或用户的电话声音等。如果识别出语音信息为噪音,则在此情况下不生成对应的控制指令。
[0034]在一些实施方式中,上述预设应用包括购物类应用。本申请实施例可以在带屏语音交互设备的操作系统的快速启动栏(Quick Start Bar,QSB)或快速启动面板(Launch Pad)中增加该预设应用程序包的入口。
[0035]图2为根据本申请一实施例的语音控制方法中,步骤S102的一种实现流程图,包括以下步骤:
[0036]S201:将识别结果与页面中的各元素进行匹配检测;
[0037]S202:在匹配成功的情况下,根据该识别结果生成针对页面中匹配成功的元素的第一控制指令。
[0038]可选地,上述页面中的元素为可读元素。以预设应用为购物类应用为例,在一些应用场景中,带屏语音交互设备当前显示某购物类应用的主页。主页中显示有不同的商品类别,如数码电器、图书、生鲜等;如果识别出语音信息对应的识别结果为“数码电器”,则可以生成对主页中“数码电器”类别的点击操作,从而打开“数码电器”类别对应的页面。
[0039]在一些实施方式中,上述步骤S102还可以包括:根据上述识别结果,生成用于浏览上述页面的第一控制指令。
[0040]不同于上述实施例中打开其他页面的情况,本实施例是对当前显示的页面进行控制,从而实现对当前显示页面的浏览。例如,如果识别出语音信息对应的识别结果为“上一页”、“下一页”、“翻页”、“上一个”、“下一个”,则可以根据该识别结果生成对当前页面的第一控制指令。
[0041]可见,采用本申请实施例提出的语音控制方法,可以模拟对预设应用页面的触碰操作,实现对预设应用的页面进行控制。
[0042]图3为根据本申请一实施例的语音控制方法的实现流程图二。如图3所示,在一些实施方式中,上述步骤S103之后还包括:
[0043]S304:在根据识别结果无法生成针对页面的第一控制指令的情况下,生成针对带屏语音交互设备的第二控制指令;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音控制方法,其特征在于,包括:在带屏语音交互设备显示预设应用的页面的情况下,对接收到的语音信息进行识别,得到识别结果;根据所述识别结果生成针对所述页面的第一控制指令;采用所述第一控制指令对所述页面进行控制。2.根据权利要求1所述的方法,其特征在于,所述根据所述识别结果生成针对所述页面的第一控制指令,包括:将所述识别结果与所述页面中的各元素进行匹配检测;在匹配成功的情况下,根据所述识别结果生成针对所述页面中匹配成功的元素的第一控制指令。3.根据权利要求1所述的方法,其特征在于,所述根据所述识别结果生成针对所述页面的第一控制指令,包括:根据所述识别结果,生成用于浏览所述页面的第一控制指令。4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:在根据所述识别结果无法生成针对所述页面的第一控制指令的情况下,生成针对所述带屏语音交互设备的第二控制指令;采用所述第二控制指令对所述带屏语音交互设备进行控制。5.根据权利要求1至3任一所述的方法,其特征在于,所述预设应用包括购物类应用。6.一种语音控制装置,其特征在于,包括:识别模块,用于在带屏语音交互设备显示预设应用的页面的情况下,对接收到的语音信息进行识别,得到识别结果;指令生成模块,用于根据所述识别结果生成针对所述页面的第一控制指令;页面控制模块,用于采用所述第一控制指令对所述页...

【专利技术属性】
技术研发人员:傅迪徐春霞陈晨钱露陈振涛杨晓彬张黎
申请(专利权)人:上海小度技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1