【技术实现步骤摘要】
语音控制方法、装置、电子设备以及存储介质
[0001]本申请涉及电子设备
,更具体地,涉及一种语音控制方法、装置、电子设备以及存储介质。
技术介绍
[0002]随着科学技术的发展,用户通过语音控制电子设备的使用越来越广泛,功能越来越多,已经成为人们日常生活中的必备之一。目前,运用语音控制电子设备不够准确,会出现识别错误的情况,用户体验不佳。
技术实现思路
[0003]鉴于上述问题,本申请提出了一种语音控制方法、装置、电子设备以及存储介质,以解决上述问题。
[0004]第一方面,本申请实施例提供了一种语音控制方法,所述方法包括:显示图形界面;响应语音交互指令,获取所述图形界面对应的图形界面截图;对所述图形界面截图进行处理,获得所述图形界面中包括的多个目标元素;当通过所述多个目标元素组成多个满足预设排列规则的元素集合时,按对应的集合尺寸从大到小的顺序从多个元素集合中筛选出目标元素集合,其中,所述目标元素集合由所述多个目标元素中的至少两个目标元素组成;对所述至少两个目标元素进行索引编号,获得所述至少两 ...
【技术保护点】
【技术特征摘要】
1.一种语音控制方法,其特征在于,所述方法包括:显示图形界面;响应语音交互指令,获取所述图形界面对应的图形界面截图;对所述图形界面截图进行处理,获得所述图形界面中包括的多个目标元素;当通过所述多个目标元素组成多个满足预设排列规则的元素集合时,按对应的集合尺寸从大到小的顺序从多个元素集合中筛选出目标元素集合,其中,所述目标元素集合由所述多个目标元素中的至少两个目标元素组成;对所述至少两个目标元素进行索引编号,获得所述至少两个目标元素各自对应的目标索引编号;基于所述至少两个目标元素各自对应的目标索引编号,从所述至少两个目标元素中确定所述语音交互指令对应的目标元素。2.根据权利要求1所述的方法,其特征在于,所述对所述图形界面截图进行处理,获得所述图形界面中包括的多个目标元素,包括:对所述图形界面截图进行检测,获取所述图形界面中包括的多个元素;对所述多个元素进行去重,获得所述图形界面中包括的多个目标元素。3.根据权利要求2所述的方法,其特征在于,所述对所述图形界面截图进行检测,获取所述图形界面中包括的多个元素,包括:通过第一方式对所述图形界面截图进行检测,获取所述图形界面中包括的多个第一元素,其中,所述多个第一元素在所述图形界面中显示;通过第二方式对所述图形界面截图进行检测,获取所述图形界面中包括的多个第二元素,其中,所述多个第二元素在所述图形界面中隐藏;所述对所述多个元素进行去重,获得所述图形界面中包括的多个目标元素,包括:对所述多个第一元素和所述多个第二元素进行去重处理,获得所述图形界面中包括的多个目标元素。4.根据权利要求3所述的方法,其特征在于,所述对所述多个第一元素和所述多个第二元素进行去重处理,获得所述图形界面中包括的多个目标元素,包括:获取所述多个第一元素和所述多个第二元素中,重叠的元素之间的重叠区域比例;当所述重叠区域比例大于或等于比例阈值时,从所述重叠的元素中保留尺寸最大的元素;当所述重叠区域比例小于所述比例阈值时,保留所述重叠的元素。5.根据权利要求3所述的方法,其特征在于,所述通过第二方式对所述图形界面截图进行检测,获取所述图形界面中包括的多个第二元素,其中,所述多个第二元素在所述图形界面中隐藏,包括:基于元素检测模型对所述图形界面截图进行检测,获取所述图形界面中包括的所述多个第二元素,其中,所述元素检测模型基于对图形界面的布局规则进行学习获得。6.根据权利要求1
‑
5任一项所述的方法,其特征在于,所述对所述至少两个目标元素进行索引编号,获得所述至少两个目标元素各自对应的目标索引编号,包括:获取所述目标元素集合对应的元素尺寸在所述图形界面的占比;当所述占比大于或等于占比阈值时,获得所述至少两个目标元素各自对应的目标索引
编号。7.根据权利要求6所述的方法,其特征在于,在所述当所述占比大于或等于占比阈值时,获得所述至少两个目标元素各自对应的目标索引编号之前,还包括:对所述语音交互指令进行解析,获得所述语音交互指令所包含的语音信息;基于所述语音信息,确定所述占比阈值。8.根据权利要求7所述的方法,其特征在于,所述基于所述语音信息,确定所述占比阈值,包括:当所述语音信息同时包括文本描述和索引编号时,确定所述占比阈值为第一占比阈值,所述图形界面包括至少两个部分,所述至少两个部分中的每个部分包括关键词和多个目标元素,所述关键词与所...
【专利技术属性】
技术研发人员:陈明,张晓帆,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。