一种浏览器的语音交互方法、装置、终端和存储介质制造方法及图纸

技术编号：17879038 阅读：43 留言：0更新日期：2018-05-06 00:49

本发明专利技术实施例公开了一种浏览器的语音交互方法、装置、终端和存储介质。该方法包括：实时监听用户录入的语音指令；对监听到的语音指令进行意图识别；将识别到的语音指令的意图与浏览器中包含的各控制指令的意图进行匹配，并执行匹配成功的控制指令。本发明专利技术实施例无需唤醒，且实时监听用户录入的语音指令，对监听到的语音指令进行意图识别，并对识别出的意图进行匹配，以此匹配到符合用户录入的语音指令意图的控制指令，并执行该控制指令。实现全局通过语音交互进行搜索和浏览的功能，无需用户的启动或手动操作，通过自然语言即可对浏览器实现语音的控制，进而提升用户体验。

A browser's voice interaction method, device, terminal and storage medium

The embodiment of the invention discloses a browser's voice interaction method, device, terminal and storage medium. The method includes: listening to the voice instructions recorded by the user in real time; the intention recognition of the voice instructions heard by the supervisor; the intention of the speech instruction identified with the intention of the control instructions contained in the browser is matched, and the successful control instruction is executed. The embodiment of the invention does not need to wake up, and monitors the voice instructions recorded by the user in real time, recognizes the voice instructions heard and matches the identified intention, and matches the control instructions that conform to the voice instruction intention of the user and executes the control instruction. The function of searching and browsing through the global voice interaction can be realized without user's start or manual operation. It can control the browser by natural language, and then improve the user experience.

全部详细技术资料下载

【技术实现步骤摘要】
一种浏览器的语音交互方法、装置、终端和存储介质
本专利技术实施例涉及互联网
，尤其涉及一种浏览器的语音交互方法、装置、终端和存储介质。
技术介绍
人工智能虽然作为目前的研究重点，但传统且成熟的搜索和浏览器类的平台型产品，已让用户养成了人工操作来搜索和浏览的习惯，因此难以利用人工智能类的新技术和新设计完全颠覆传统的用户搜索和浏览的方式。现有搜索类和浏览器类产品逐渐集成有新的技术，并且主要是通过插件形式，例如语音和拍照搜索插件，在现有产品框架中另外集成了一部分独立的功能，隶属于产品的一部分。但此类插件入口很深，用户感知度较低，不利于产品的改进以及用户使用习惯的养成。而主推人工智能新技术的全新的智能助手，虽然有全新的产品形态，但未能与传统业务很好的结合，也无法很好地养成用户的使用习惯以及产品的长久使用，多为尝鲜类用户的短暂使用，用户普及度不够。上述两种方式，都不利于用户养成并维持对于新的交互技术的使用习惯。以插件的形式集成在传统平台的产品对新技术的突出力度不够，且产品形态受限；智能助手与现有产品脱节严重。
技术实现思路
本专利技术实施例提供了一种浏览器的语音交互方法、装置、终端和存储介质，通过全局语音交互实现搜索和浏览功能，提升用户体验。第一方面，本专利技术实施例提供了一种浏览器的语音交互方法，包括：实时监听用户录入的语音指令；对监听到的语音指令进行意图识别；将识别到的语音指令的意图与浏览器中包含的各控制指令的意图进行匹配，并执行匹配成功的控制指令。第二方面，本专利技术实施例提供了一种浏览器的语音交互装置，包括：监听模块，用于实时监听用户录入的语音指令；识别模...
一种浏览器的语音交互方法、装置、终端和存储介质

【技术保护点】
一种浏览器的语音交互方法，其特征在于，包括：实时监听用户录入的语音指令；对监听到的语音指令进行意图识别；将识别到的语音指令的意图与浏览器中包含的各控制指令的意图进行匹配，并执行匹配成功的控制指令。

【技术特征摘要】
1.一种浏览器的语音交互方法，其特征在于，包括：实时监听用户录入的语音指令；对监听到的语音指令进行意图识别；将识别到的语音指令的意图与浏览器中包含的各控制指令的意图进行匹配，并执行匹配成功的控制指令。2.根据权利要求1所述的方法，其特征在于，所述实时监听用户录入的语音指令，包括：若当前页面是网页，且用户录入任一语音指令的时间长度大于时间长度阈值，则结束该语音指令的获取。3.根据权利要求1所述的方法，其特征在于，在所述实时监听用户录入的语音指令之后，包括：若监听到的语音指令的起始语音是搜索启动语音，则依据所述起始语音之后的所述语音指令确定搜索词进行搜索。4.根据权利要求1所述的方法，其特征在于，所述对监听到的语音指令进行意图识别，包括：依据预先构建的意图识别模型对监听到的语音指令进行意图识别，其中所述意图识别模型是依据预先采集的触发浏览器中各控制指令的语料集，以及所述各控制指令所属的意图进行深度学习模型训练得到的。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：依据当前工作状态，在所述当前页面的语音状态展示区域中展示语音处理状态提醒。6.根据权利要求5所述的方法，其特征在于，所述依据当前工作状态，在所述当前页面的语音状态展示区域中展示语音处理状态提醒，包括：若处于语音采集等待状态，则在所述当前页面的语音状态展示区域中展示监听中可录入状态提示符，以提示用户直接进行语音输入；若处于用户语音采集过程中，则在所述语音状态展示区域中展示语音采集和识别中提示符，并显示实时的语音识别结果；若处于意图识别过程中，则在所述语音状态展示区域中展示意图识别中提示符。7.根据权利要求5所述的方法，其特征在于，所述方法还包括：若所述当前页面是首页，则将中心区域确定为语音状态展示区域；若所述当前页面是网页，则将底部工具栏确定为语音状态展示区域。8.根据权利要求1所述的方法，其特征在于，所述方法还包括：若在网页中检测到滑动操作，则缩小集成有地址栏和搜索框的工具栏所占的页面面...

【专利技术属性】
技术研发人员：李天赐，丁艳红，王欣彤，丁熙荣，李赋博，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人