界面智能交互控制方法、装置、系统及存储介质制造方法及图纸

技术编号:16876284 阅读:35 留言:0更新日期:2017-12-23 13:35
本发明专利技术公开了界面智能交互控制方法、装置、系统及存储介质,其中方法包括:接收用户输入的语音信息,并获取语音识别结果;确定出与语音识别结果相关联的场景元素;针对每个场景元素,分别生成对应的条目,并将语音识别结果以及条目发送给云端服务器;接收云端服务器返回的、从接收到的条目中选出的与语音识别结果最为匹配的条目;执行最为匹配的条目对应的界面操作。应用本发明专利技术所述方案,能够提高语音控制的灵活性和准确性等。

Interface intelligent interactive control method, device, system and storage medium

The present invention discloses interface intelligent interactive control method, device, system and storage medium, wherein the method comprises: receiving user input voice information, and get the speech recognition results; identify related speech recognition results with the elements of a scene; for each scene elements, respectively, generate the corresponding entries, and the speech recognition results and items sent to the cloud server; receiving cloud server, from the received items selected and the speech recognition results to match most items; the interface operation, corresponding entry for execution. The application of the present invention can improve the flexibility and accuracy of speech control.

【技术实现步骤摘要】
界面智能交互控制方法、装置、系统及存储介质
本专利技术涉及计算机应用技术,特别涉及界面智能交互控制方法、装置、系统及存储介质。
技术介绍
随着技术的发展,具有语音交互功能的智能设备越来越多。用户可对智能设备进行语音控制,如用户可发出语音信息,要求智能设备执行某种操作等。智能设备在接收到用户输入的语音信息后,可将其发送给云端服务器,并接收云端服务器进行语音识别后返回的指令或搜索出的资源,相应地,智能设备执行指令对应的操作或展示资源。但是,上述方式在实际应用中会存在一定的问题,比如:语音控制通常只是针对系统级的指令,云端服务器可返回的指令集是固定的,对于指令集中不存在的指令,则无法执行对应的操作,假设当前界面上展示了一个“收藏”按钮,用户发出了“收藏”的语音信息,但由于云端服务器中未存储该指令,那么则无法执行对应的操作,可见,现有语音控制方式具有很大的局限性;另外,假设当前界面上展示了10部电影,包括每部电影的名称及播放地址,这些云端服务器都是不知道的,这样,如果用户想看其中的某部电影,说出电影名称之后,云端服务器并不知道用户想看的是当前界面上展示的一部电影,只会对电影名称进行检索,而返回的结果很可能并不是用户想要的,如可能是名称相同或相似的其它电影,从而降低了语音控制的准确性。
技术实现思路
有鉴于此,本专利技术提供了界面智能交互控制方法、装置、系统及存储介质,能够提高语音控制的灵活性和准确性。具体技术方案如下:一种界面智能交互控制方法,包括:接收用户输入的语音信息,并获取语音识别结果;确定出与所述语音识别结果相关联的场景元素;针对每个场景元素,分别生成对应的条目,并将所述语音识别结果以及所述条目发送给云端服务器;接收所述云端服务器返回的、从接收到的条目中选出的与所述语音识别结果最为匹配的条目;执行所述最为匹配的条目对应的界面操作。根据本专利技术一优选实施例,所述获取语音识别结果包括:将所述语音信息发送给所述云端服务器;接收所述云端服务器对所述语音信息进行语音识别后返回的所述语音识别结果。根据本专利技术一优选实施例,所述针对每个场景元素,分别生成对应的条目包括:每个条目中包括:元素标签以及对应的自定义操作行为信息;所述执行所述最为匹配的条目对应的界面操作包括:根据所述最为匹配的条目中的自定义操作行为信息,执行界面操作。一种界面智能交互控制方法,包括:接收来自智能设备的语音识别结果以及条目,其中,所述语音识别结果为所述智能设备接收到的用户输入的语音信息的语音识别结果,所述条目为所述智能设备在确定出与所述语音识别结果相关联的场景元素后,针对每个场景元素分别生成的对应的条目;从接收到的条目中选出与所述语音识别结果最为匹配的条目,并将所述最为匹配的条目返回给所述智能设备,以便所述智能设备执行所述最为匹配的条目对应的界面操作。根据本专利技术一优选实施例,所述接收来自智能设备的语音识别结果以及条目之前,进一步包括:接收所述智能终端发送来的所述语音信息;对所述语音信息进行语音识别,得到所述语音识别结果,返回给所述智能设备。根据本专利技术一优选实施例,每个条目中包括:元素标签以及对应的自定义操作行为信息;所述从接收到的条目中选出与所述语音识别结果最为匹配的条目包括:根据所述元素标签,从接收到的条目中选出与所述语音识别结果最为匹配的条目。根据本专利技术一优选实施例,所述根据所述元素标签,从接收到的条目中选出与所述语音识别结果最为匹配的条目包括:针对每个条目,分别计算所述条目的元素标签与所述语音识别结果之间的编辑距离;将取值最小的编辑距离对应的条目作为所述最为匹配的条目。根据本专利技术一优选实施例,每个条目中进一步包括以下之一或全部:表明场景元素所处行列位置的x值和y值、表明场景元素的排列序号的index值;所述从接收到的条目中选出与所述语音识别结果最为匹配的条目包括:根据所述x值和y值,或根据所述index值,从接收到的条目中选出与所述语音识别结果最为匹配的条目。一种智能设备,包括:第一获取单元、第一控制单元以及第二控制单元;所述第一获取单元,用于接收用户输入的语音信息,并获取语音识别结果;所述第一控制单元,用于确定出与所述语音识别结果相关联的场景元素,针对每个场景元素,分别生成对应的条目,将所述语音识别结果以及所述条目发送给云端服务器,接收所述云端服务器返回的、从接收到的条目中选出的与所述语音识别结果最为匹配的条目;所述第二控制单元,用于执行所述最为匹配的条目对应的界面操作。根据本专利技术一优选实施例,所述第一获取单元进一步用于,将所述语音信息发送给所述云端服务器;接收所述云端服务器对所述语音信息进行语音识别后返回的所述语音识别结果。根据本专利技术一优选实施例,每个条目中包括:元素标签以及对应的自定义操作行为信息;所述第二控制单元根据所述最为匹配的条目中的自定义操作行为信息,执行界面操作。一种云端服务器,包括:第二获取单元以及匹配单元;所述第二获取单元,用于接收来自智能设备的语音识别结果以及条目,其中,所述语音识别结果为所述智能设备接收到的用户输入的语音信息的语音识别结果,所述条目为所述智能设备在确定出与所述语音识别结果相关联的场景元素后,针对每个场景元素分别生成的对应的条目;所述匹配单元,用于从接收到的条目中选出与所述语音识别结果最为匹配的条目,并将所述最为匹配的条目返回给所述智能设备,以便所述智能设备执行所述最为匹配的条目对应的界面操作。根据本专利技术一优选实施例,所述第二获取单元进一步用于,在接收来自智能设备的语音识别结果以及条目之前,接收所述智能终端发送来的所述语音信息;对所述语音信息进行语音识别,得到所述语音识别结果,返回给所述智能设备。根据本专利技术一优选实施例,每个条目中包括:元素标签以及对应的自定义操作行为信息;所述匹配单元根据所述元素标签,从接收到的条目中选出与所述语音识别结果最为匹配的条目。根据本专利技术一优选实施例,所述匹配单元针对每个条目,分别计算所述条目的元素标签与所述语音识别结果之间的编辑距离,将取值最小的编辑距离对应的条目作为所述最为匹配的条目。一种界面智能交互控制系统,包括:如以上所述的智能设备,以及,如以上所述的云端服务器。一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。基于上述介绍可以看出,采用本专利技术所述方案,智能设备可接收用户输入的语音信息,并获取语音识别结果,之后确定出与语音识别结果相关联的场景元素,并针对每个场景元素,分别生成对应的条目,进而将语音识别结果以及生成的条目发送给云端服务器,之后,可接收云端服务器返回的、从接收到的条目中选出的与语音识别结果最为匹配的条目,进而执行最为匹配的条目对应的界面操作;相比于现有技术,本专利技术所述方案中可根据用户输入的语音信息生成并选出条目,进而根据选出的条目执行界面操作,不再局限于指令集中的指令,从而提高了语音控制的灵活性,而且,本专利技术所述方案中是在智能设备发送的与语音识别结果相关联的场景元素对应的条目中进行筛选,找出与语音识别结果最为匹配的条目,匹配结果更为准确,从而提高了语音控制的准确性。【附本文档来自技高网...
界面智能交互控制方法、装置、系统及存储介质

【技术保护点】
一种界面智能交互控制方法,其特征在于,包括:接收用户输入的语音信息,并获取语音识别结果;确定出与所述语音识别结果相关联的场景元素;针对每个场景元素,分别生成对应的条目,并将所述语音识别结果以及所述条目发送给云端服务器;接收所述云端服务器返回的、从接收到的条目中选出的与所述语音识别结果最为匹配的条目;执行所述最为匹配的条目对应的界面操作。

【技术特征摘要】
1.一种界面智能交互控制方法,其特征在于,包括:接收用户输入的语音信息,并获取语音识别结果;确定出与所述语音识别结果相关联的场景元素;针对每个场景元素,分别生成对应的条目,并将所述语音识别结果以及所述条目发送给云端服务器;接收所述云端服务器返回的、从接收到的条目中选出的与所述语音识别结果最为匹配的条目;执行所述最为匹配的条目对应的界面操作。2.根据权利要求1所述的方法,其特征在于,所述获取语音识别结果包括:将所述语音信息发送给所述云端服务器;接收所述云端服务器对所述语音信息进行语音识别后返回的所述语音识别结果。3.根据权利要求1所述的方法,其特征在于,所述针对每个场景元素,分别生成对应的条目包括:每个条目中包括:元素标签以及对应的自定义操作行为信息;所述执行所述最为匹配的条目对应的界面操作包括:根据所述最为匹配的条目中的自定义操作行为信息,执行界面操作。4.一种界面智能交互控制方法,其特征在于,包括:接收来自智能设备的语音识别结果以及条目,其中,所述语音识别结果为所述智能设备接收到的用户输入的语音信息的语音识别结果,所述条目为所述智能设备在确定出与所述语音识别结果相关联的场景元素后,针对每个场景元素分别生成的对应的条目;从接收到的条目中选出与所述语音识别结果最为匹配的条目,并将所述最为匹配的条目返回给所述智能设备,以便所述智能设备执行所述最为匹配的条目对应的界面操作。5.根据权利要求4所述的方法,其特征在于,所述接收来自智能设备的语音识别结果以及条目之前,进一步包括:接收所述智能终端发送来的所述语音信息;对所述语音信息进行语音识别,得到所述语音识别结果,返回给所述智能设备。6.根据权利要求4所述的方法,其特征在于,每个条目中包括:元素标签以及对应的自定义操作行为信息;所述从接收到的条目中选出与所述语音识别结果最为匹配的条目包括:根据所述元素标签,从接收到的条目中选出与所述语音识别结果最为匹配的条目。7.根据权利要求6所述的方法,其特征在于,所述根据所述元素标签,从接收到的条目中选出与所述语音识别结果最为匹配的条目包括:针对每个条目,分别计算所述条目的元素标签与所述语音识别结果之间的编辑距离;将取值最小的编辑距离对应的条目作为所述最为匹配的条目。8.根据权利要求6所述的方法,其特征在于,每个条目中进一步包括以下之一或全部:表明场景元素所处行列位置的x值和y值、表明场景元素的排列序号的index值;所述从接收到的条目中选出与所述语音识别结果最为匹配的条目包括:根据所述x值和y值,或根据所述index值,从接收到的条目中选出与所述语音识别结果最为匹配的条目。9.一种智能设备,其特征在于,包括:第一获取单元、第一控制单元以及第二控制单元;所述第一获取单元,用于接收用户输入的语音信息,并获取语音识别结果;所述第一控制单元,用于确定出与所述语音识别结果相关联的场景元素,针对每个场景...

【专利技术属性】
技术研发人员:程高飞蒋祥涛徐犇欧林鑫熊芩
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1