页面交互方法、装置和电子设备制造方法及图纸

技术编号:25479855 阅读:15 留言:0更新日期:2020-09-01 23:01
本申请公开了一种页面交互方法,涉及计算机技术领域的语音技术领域。具体实现方案为:通过获取页面的可执行交互内容;获取语音信息;对语音信息进行意图识别,以从可执行交互内容中,确定与语音信息的意图相匹配的目标交互;在页面执行目标交互。由此,通过在页面执行与用户输入的语音信息的意图相匹配的目标交互,实现了用户采用语音方式可以和网页进行交互,提高了用户与页面交互的效率。

【技术实现步骤摘要】
页面交互方法、装置和电子设备
本申请涉及计算机
的语音
,尤其涉及一种页面交互方法、装置和电子设备。
技术介绍
网页是互联网最大的信息载体,在个人电脑(PersonalComputer,简称PC)的互联网时代,人们使用鼠标点击、滚动以及键盘输入的方式与网页进行交互;而在移动互联网时代,人们使用手指点击、滑动的方式与网页进行交互。但是,无论使用鼠标点击、滚动、键盘输入的方式,还是使用手指触摸的方式与网页进行交互,均存在输入效率低,从而导致用户与网页交互时存在效率低的技术问题。
技术实现思路
本申请提供了一种页面交互方法、装置、电子设备以及存储介质。本申请第一方面实施例提供了一种页面交互方法,包括:获取页面的可执行交互内容;获取语音信息;对所述语音信息进行意图识别,以从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互;在所述页面执行所述目标交互。本申请第二方面实施例提供了另一种页面交互方法,包括:获取页面前端识别页面得到的可执行交互内容;获取语音信息;对所述语音信息进行意图识别,以从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互;向所述页面前端发送所述目标交互的交互指令;所述交互指令,用于在所述页面执行所述目标交互。本申请第三方面实施例提供的了一种页面交互装置,包括:第一获取模块,用于获取页面的可执行交互内容;第二获取模块,用于获取语音信息;意图识别模块,用于对所述语音信息进行意图识别,以从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互;执行模块,用于在所述页面执行所述目标交互。本申请第四方面实施例提供的了另一种页面交互装置,包括:交互获取模块,用于获取页面前端识别页面得到的可执行交互内容;语音获取模块,用于获取语音信息;识别模块,用于对所述语音信息进行意图识别,以从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互;发送模块,用于向所述页面前端发送所述目标交互的交互指令;所述交互指令,用于在所述页面执行所述目标交互。本申请第五方面实施例提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面实施例的页面交互方法,或者,第二方面实施例的页面交互方法。本申请第六方面实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行第一方面实施例的页面交互方法,或者,第二方面实施例的页面交互方法。上述申请中的一个实施例具有如下优点或有益效果:通过获取页面的可执行交互内容;获取语音信息;对语音信息进行意图识别,以从可执行交互内容中,确定与语音信息的意图相匹配的目标交互;在页面执行目标交互。由此,通过在页面执行与用户输入的语音信息的意图相匹配的目标交互,实现了用户采用语音方式即可与网页进行交互,提高了用户与页面交互的效率。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1为本申请实施例一提供的页面交互方法的流程示意图;图2为本申请实施例二提供的页面交互方法的流程示意图;图3为本申请实施例三提供的页面交互方法的流程示意图;图4为本申请实施例四提供的页面交互方法的流程示意图;图5为本申请实施例五提供的页面交互方法的流程示意图;图6为本申请实施例六提供的页面交互过程的示例图;图7为本申请实施例提供的用户与页面交互的示意图;图8为本申请实施例七提供的页面交互装置的结构示意图;图9为本申请实施例八提供的页面交互装置的结构示意图;图10是用来实现本申请实施例的页面交互的方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。相关技术中,用于只能使用鼠标点击、滚动、键盘输入、手指触摸的方式与网页进行交互,无法使用语音控制的方式与网页进行交互。相比语音交互的方式,使用鼠标和手指触摸的方式与网页进行交互有如下劣势:从输入效率来说,用户用键盘打字效率远比语音输入效率低;从学习成本来说,使用电脑和手机需要一定知识学习作为基础,而语音则不需要;从操作距离来说,用户必须和设备近距离接触,有些场景下显得很不便利。针对上述现有的用户与网页进行交互时存在的技术问题,本申请提出了一种网页交互方法,通过获取页面的可执行交互内容;获取语音信息;对语音信息进行意图识别,以从可执行交互内容中,确定与语音信息的意图相匹配的目标交互;在页面执行目标交互。由此,实现了通过语音交互的方式与网页进行交互,用户无需额外学习使用文字、无需接触设备,只需要说话就可以和网页进行交互,提高了交互的效率。下面参考附图描述本申请实施例的页面交互方法、装置、电子设备和存储介质。图1为本申请实施例一提供的页面交互方法的流程示意图。本申请实施例以该页面交互方法被配置于页面交互装置中来举例说明,该页面交互装置可以应用于任一电子设备中,以使该电子设备可以执行页面交互功能。其中,电子设备可以为PC、云端设备、移动设备等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统的硬件设备。作为一种示例,电子设备可以包括语音模块、页面前端和服务端模块。例如,语音模块获取用户说话的语音;页面前端识别页面,得到页面的可执行交互内容;服务端模块对从语音模块获取到的语音进行意图识别,以从可执行交互内容中,确定与语音信息的意图相匹配的目标交互;进而,页面前端在页面执行目标交互。由此,实现用户与网页页面进行语音交互的功能。下面结合图1对上述电子设备执行页面交互功能的过程进行详细介绍。如图1所示,该页面交互方法,可以包括以下步骤:步骤101,获取页面的可执行交互内容。其中,页面可以为超文本标记语言(HyperTextMarkupLanguage,简称HTML)页面。例如,百度浏览器展示的页面,谷歌浏览器展示的页面,等等。本申请中,可以通过页面前端的HTMLParser模块解析HTML页面,以得到页面的可执行交互内容。其中,HTMLParser是计算机程序设计语言Python中自带的专门用来解析HTML的模块本文档来自技高网...

【技术保护点】
1.一种页面交互方法,其特征在于,所述方法包括:/n获取页面的可执行交互内容;/n获取语音信息;/n对所述语音信息进行意图识别,以从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互;/n在所述页面执行所述目标交互。/n

【技术特征摘要】
1.一种页面交互方法,其特征在于,所述方法包括:
获取页面的可执行交互内容;
获取语音信息;
对所述语音信息进行意图识别,以从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互;
在所述页面执行所述目标交互。


2.根据权利要求1所述的页面交互方法,其特征在于,所述从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互,包括:
根据所述可执行交互内容,确定所述页面中目标元素可执行的交互操作;
从所述目标元素可执行的交互操作中,确定与所述意图匹配的目标操作;
根据所述目标元素和所述目标操作,生成所述目标交互的交互指令。


3.根据权利要求2所述的页面交互方法,其特征在于,所述确定所述页面中目标元素可执行的交互操作之前,还包括:
根据所述可执行交互内容,确定所述页面中多个交互元素的交互目的;
从多个所述交互元素中,确定所述目标元素,其中,所述目标元素的交互目的与所述意图匹配。


4.根据权利要求1所述的页面交互方法,其特征在于,所述获取页面的可执行交互内容,包括:
解析所述页面,以得到各所述交互元素响应的操作;
将各所述交互元素响应的操作,作为各所述交互元素可执行的交互操作;
根据各所述交互元素可执行的交互操作,生成所述可执行交互内容的列表。


5.根据权利要求4所述的页面交互方法,其特征在于,所述根据各所述交互元素可执行的交互操作,生成所述可执行交互内容的列表,包括:
获取解析所述页面得到的各所述交互元素的文本描述;
将所述各交互元素的文本描述,作为各交互元素的所述交互目的;
根据各交互元素的所述交互操作和各交互元素的所述交互目的,生成所述可执行交互内容的列表。


6.根据权利要求1-5任一项所述的页面交互方法,其特征在于,所述对所述语音信息进行意图识别,包括:
获取模板库;
将所述模板库中各模板,分别与所述语音信息匹配;
若所述模板库中存在句式与所述语音信息匹配的目标模板,则根据所述目标模板,对所述语音信息进行意图识别;
若所述模板库中不存在句式与所述语音信息匹配的目标模板,则采用语义模型对所述语音信息进行意图识别。


7.根据权利要求6所述的页面交互方法,其特征在于,所述根据所述目标模板,对所述语音信息进行意图识别,包括:
根据所述目标模板中设置的槽位,在所述语音信息中与所述槽位对应文本位置,提取得到所述槽位的填槽内容;将所述槽位的填槽内容作为所述语音信息的意图;
或者,将所述目标模板对应的意图,作为所述语音信息的意图。


8.根据权利要求6所述的页面交互方法,其特征在于,所述采用语义模型对所述语音信息进行意图识别,包括:
对所述语音信息分词,得到各分词的特征;所述特征包括语义特征和词性特征;
将各分词的特征输入所述语义模型,得到所述语音信息的意图。


9.一种页面交互方法,其特征在于,所述方法包括:
获取页面前端识别页面得到的可执行交互内容;
获取语音信息;
对所述语音信息进行意图识别,以从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互;
向所述页面前端发送所述目标交互的交互指令;所述交互指令,用于在所述页面执行所述目标交互。


10.根据权利要求9所述的页面交互方法,其特征在于,所述从所述可执行交互内容中,确定与所述语音信息的意图相匹配的目标交互,包括:
根据所述可执行交互内容,确定所述页面中目标元素可执行的交互操作;
从所述目标元素可执行的交互操作中,确定与所述意图匹配的目标操作;
根据所述目标元素和所述目标操作,生成所述目标交互的交互指令。


11.根据权利要求10所述的页面交互方法,其特征在于,所述确定所述页面中目标元素可执行的交互操作之前,还包括:
根据所述可执行交互内容,确定所述页面中多个交互元素的交互目的;
从多个所述交互元素中,确定所述目标元素,其中,所述目标元素的交互目的与所述意图匹配。


12.根据权利要求9所述的页面交互方法,其特征在于,所述获取页面前端识别页面得到的可执行交互内容,包括:
解析所述页面,以得到各所述交互元素响应的操作;
将各所述交互元素响应的操作,作为各所述交互元素可执行的交互操作;
根据各所述交互元素可执行的交互操作,生成所述可执行交互内容的列表。


13.根据权利要求12所述的页面交互方法,其特征在于,所述根据各所述交互元素可执行的交互操作,生成所述可执行交互内容的列表,包括:
获取解析所述页面得到的各所述交互元素的文本描述;
将所述各交互元素的文本描述,作为各交互元...

【专利技术属性】
技术研发人员:唐子杰张海杰麻雪云程磊生曹文强曹彬陈奇吴开放吕晟邵领张弛王珍
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1