语音控制的方法和装置制造方法及图纸

技术编号:21895693 阅读:19 留言:0更新日期:2019-08-17 16:01
本发明专利技术实施例提供了一种语音控制的方法和装置,涉及语音控制技术领域,所述方法包括获取与当前显示界面对应的界面图像;根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像;根据所述目标控件图像在所述界面图像中的位置,确定与所述目标控件图像对应的目标可触发控件在所述当前显示界面中的目标位置;将所述光标移动至所述目标位置。本发明专利技术实施例基于图像识别技术实现语音控制光标移动,以提高语音识别技术与操作界面的交互性。

The Method and Device of Speech Control

【技术实现步骤摘要】
语音控制的方法和装置
本专利技术涉及语音控制
,特别是涉及一种语音控制的方法和一种语音控制的装置。
技术介绍
随着通讯技术的不断发展,终端的控制方式越来越丰富,也越来越智能。在人机交互应用中,语音识别技术逐渐进入我们的日常生活,如现有的智能手机、平板电脑、智能电视等都附带有语音识别功能。虽然现有的语音识别技术可以实现指定范围内较为简单的单一指令任务,例如“打开相机”的操作。但是,现有的语音识别技术与当前操作界面上显示的内容无关,交互性小,且不能控制光标在操作界面上移动,也不能直接触发当前操作界面上对应的可触发控件。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种语音控制的方法和相应的一种语音控制的装置。为了解决上述问题,本专利技术实施例公开了一种语音控制的方法,包括获取与当前显示界面对应的界面图像;根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像;根据所述目标控件图像在所述界面图像中的位置,确定与所述目标控件图像对应的目标可触发控件在所述当前显示界面中的目标位置;将所述光标移动至所述目标位置。在一优选实施方式中,所述根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像的步骤,包括:识别所述界面图像,对所述界面图像包含的控件图像匹配对应的语音标识;其中,所述控件图像与所述当前显示界面中可触发控件一一对应;将与所述语音指令匹配的语音标识对应的控件图像确定为目标控件图像。在一优选实施方式中,在所述根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像的步骤之前,包括:将所述界面图像划分为若干区域;在所述区域内显示对应的区域标识。在一优选实施方式中,所述语音指令包括区域语音和控件语音;所述根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像的步骤,包括:通过解析所述语音指令中的区域语音,确定对应的目标区域;识别所述界面图像中的目标区域,对所述目标区域包含的控件图像匹配对应的语音标识;其中,所述控件图像与所述当前显示界面中对应区域的可触发控件一一对应;将与所述语音指令中的控件语音匹配的语音标识对应的控件图像确定为目标控件图像。在一优选实施方式中,所述根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像的步骤,还包括:当与所述语音指令对应的控件图像包含两个以上时,在所述界面图像中对两个以上的控件图像进行编号;接收包含编号的语音选择指令;根据所述语音选择指令中的编号确定对应编号的控件图像为目标控件图像。在一优选实施方式中,所述获取与当前显示界面对应的界面图像的步骤的步骤,包括:启动语音控制模式;对当前显示界面截屏,获得与当前显示界面对应的界面图像。在一优选实施方式中,在所述根据所述目标控件图像在所述界面图像中的位置,确定与所述目标控件图像对应的目标可触发控件在所述当前显示界面中的目标位置的步骤之前,包括:获取所述当前显示界面的显示分辨率;根据所述显示分辨率建立与所述界面图像对应的图像坐标系。根据所述图像坐标系,确定所述目标控件图像的坐标。在一优选实施方式中,在所述将所述光标移动至所述目标位置的步骤之后,还包括:接收方位语音指令;根据所述方位语音指令移动所述光标。在一优选实施方式中,在所述将所述光标移动至所述目标位置的步骤之后,包括:触发所述目标位置的目标可触发控件。为了解决上述问题,本专利技术实施例公开了一种语音控制光标移动的装置,包括:界面图像获取模块,用于获取与当前显示界面对应的界面图像;图像识别模块,用于根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像;目标位置确定模块,用于根据所述目标控件图像在所述界面图像中的位置,确定与所述目标控件图像对应的目标可触发控件在所述当前显示界面中的目标位置;光标控制模块,用于将所述光标移动至所述目标位置。与现有技术相比,本专利技术实施例包括以下优点:本专利技术实施例中,通过获取与当前显示界面对应的界面图像;然后根据接收的语音指令识别界面图像中包含的控件图像,并确定与语音指令对应的目标控件图像,接着根据目标控件图像在界面图像中的位置,确定与目标控件图像对应的目标可触发控件在当前显示界面中的目标位置,最后将所述光标移动至目标位置;本专利技术实施例通过将图像识别技术与语音识别技术结合,实现语音控制光标移动,以提高语音识别技术与操作界面的交互性。附图说明图1是本专利技术实施例一的一种语音控制的方法的步骤流程图;图2是本专利技术实施例二的一种语音控制的方法的步骤流程图;图3是本专利技术实施例二中的其中一种示例的步骤流程图;图4a-4b是与图3对应的语音控制的方法的界面图像示意图;图5是本专利技术实施例二中的另一种示例的步骤流程图;图6a-6b是与图5对应的语音控制的方法的界面图像示意图;图7是本专利技术实施例语音控制的方法的界面图像示意图;图8是本专利技术实施例三的一种语音控制的装置的结构框图;图9是本专利技术实施例四的一种语音控制的装置的结构框图;图10是本专利技术实施例四中的其中一种示例的结构框图;图11是本专利技术实施例四中的另一种示例的结构框图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。本专利技术实施例的核心构思之一在于,通过获取与当前显示界面对应的界面图像;然后根据接收的语音指令识别界面图像中包含的控件图像,并确定与语音指令对应的目标控件图像,接着根据目标控件图像在界面图像中的位置,确定与目标控件图像对应的目标可触发控件在当前显示界面中的目标位置,最后将所述光标移动至目标位置;从而实现语音控制光标移动,以提高语音识别技术与操作界面的交互性。下面,通过以下具体实施例分别对本专利技术的方案进行详细介绍。实施例一:参照图1,示出了本专利技术的一种语音控制的方法实施例一的步骤流程图,具体可以包括如下步骤:步骤101,获取与当前显示界面对应的界面图像。在本专利技术实施例中,终端的显示器可以支持鼠标模式和/或支持触控模式。光标也称为游标,用于显示光标控制输入设备在操作界面上的位置,光标一般分为显式光标和隐式光标。在鼠标模式下,光标一般为显式光标,即光标显示在当前显示界面的上层,且可以移动到显示器的任意位置;在触控模式下,显示器为触控显示器,所述触控显示器包括触摸屏、手写屏等,光标一般为隐式光标,可以移动到显示器的任意位置,当符合一定条件时,隐式光标可见。当前显示界面包括至少一个可触发控件,可触发控件用于与用户进行交互,以实现相应的功能。具体的,可触发控件可以是带链接的图片或文字,也可以是工具图标等。界面图像是与当前显示界面大小图形一一对应的图像,可以通过对当前显示界面截屏得到,也可以复制当前显示界面得到,界面图像半透明呈现在当前显示界面的顶层。步骤102,根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像。在本专利技术实施例中,终端可以实现语音输入功能,以接收语音指令。根据接收的语音指令,通过图像识别技术对界面图像的整体或界面图像中的局部进行处理,从而识本文档来自技高网...

【技术保护点】
1.一种语音控制的方法,其特征在于,包括:获取与当前显示界面对应的界面图像;根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像;根据所述目标控件图像在所述界面图像中的位置,确定与所述目标控件图像对应的目标可触发控件在所述当前显示界面中的目标位置;将所述光标移动至所述目标位置。

【技术特征摘要】
1.一种语音控制的方法,其特征在于,包括:获取与当前显示界面对应的界面图像;根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像;根据所述目标控件图像在所述界面图像中的位置,确定与所述目标控件图像对应的目标可触发控件在所述当前显示界面中的目标位置;将所述光标移动至所述目标位置。2.根据权利要求1所述的方法,其特征在于,所述根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像的步骤,包括:识别所述界面图像,对所述界面图像包含的控件图像匹配对应的语音标识;其中,所述控件图像与所述当前显示界面中可触发控件一一对应;将与所述语音指令匹配的语音标识对应的控件图像确定为目标控件图像。3.根据权利要求1所述的方法,其特征在于,在所述根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像的步骤之前,包括:将所述界面图像划分为若干区域;在所述区域内显示对应的区域标识。4.根据权利要求3所述的方法,其特征在于,所述语音指令包括区域语音和控件语音;所述根据接收的语音指令识别所述界面图像中包含的控件图像,并确定与所述语音指令对应的目标控件图像的步骤,包括:通过解析所述语音指令中的区域语音,确定对应的目标区域;识别所述界面图像中的目标区域,对所述目标区域包含的控件图像匹配对应的语音标识;其中,所述控件图像与所述当前显示界面中对应区域的可触发控件一一对应;将与所述语音指令中的控件语音匹配的语音标识对应的控件图像确定为目标控件图像。5.根据权利要求1或2或4所述的方法,其特征在于,所述根据接收的语音指令识别所述界面图像中包含...

【专利技术属性】
技术研发人员:童宗伟
申请(专利权)人:深圳市语芯维电子有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1