语音识别方法、装置、设备及计算机可读介质制造方法及图纸

技术编号:17781715 阅读:49 留言:0更新日期:2018-04-22 11:25
本发明专利技术提出一种语音识别方法,包括以下步骤:指令获取步骤,获取与当前页面的业务信息相关联的指令;指令匹配步骤,接收用户输入的语音信息,判断所述语音信息是否与所述指令相匹配;指令执行步骤,若所述语音信息与所述指令相匹配,则显示指令执行结果,同时启动语音交互模式。本发明专利技术通过采用动态生成的唤醒词,可以和具体的业务紧密结合,不需要用户特地用固定唤醒词开启语音业务,从而提高用户的体验。另外,本发明专利技术还提供了一种语音识别装置、设备和计算机存储介质。

【技术实现步骤摘要】
语音识别方法、装置、设备及计算机可读介质
本专利技术涉及语音识别
,尤其涉及一种语音识别方法及装置、设备和计算机可读介质。
技术介绍
随着语音识别的能力的增强,越来越多的场景也应用到了语音识别。而对于语音识别的输入,需要先开启语音输入的功能。常规的开启方式为,在语音设备上设置开启按钮,通过点击该按钮,启动语音识别功能。由于通过点击按钮的方式启动语音识别功能的方式,需要用户额外进行手动操作,这给用户带来不好的体验。对此,现有技术提供了采用使用固定唤醒词进行启动语音识别的方式。例如,以固定名称“小度小度”等。通过使用对应的唤醒词,进入语音对话。然而,现有技术都需要使用唤醒词的方案进行语音识别能力开启,虽然不用按钮唤醒语音了,但是仍然需要多说一些特定唤醒词告知语音识别能力开始工作。
技术实现思路
本专利技术实施例提供一种语音识别方法、装置、设备及计算机可读介质,以至少解决现有技术中的以上技术问题。第一方面,本专利技术实施例提供了一种语音识别方法,包括以下步骤:指令获取步骤:获取与当前页面的业务信息相关联的指令;指令匹配步骤:接收用户输入的语音信息,判断所述语音信息是否与所述指令相匹配;指令执行步骤:若所述语音信息与所述指令相匹配,则显示指令执行结果,同时启动语音交互模式。结合第一方面,本专利技术在第一方面的第一种实现方式中,所述指令获取步骤具体为:接收由服务器生成的与当前页面的业务信息相关联的指令。结合第一方面,本专利技术在第一方面的第二种实现方式中,所述指令获取步骤具体为:生成与当前页面的业务信息相关联的指令,并将所述指令发送至服务器。结合第一方面,本专利技术在第一方面的第三种实现方式中,所述指令匹配步骤具体为:将接收的语音信息发送至服务器进行比对判断。结合第一方面,本专利技术在第一方面的第四种实现方式中,所述指令匹配步骤具体为:对接收的语音信息进行比对判断,并将判断结果发送至服务器。结合第一方面,本专利技术在第一方面的第五种实现方式中,所述指令执行步骤之后还包括语音解析步骤:对用户输入的语音解析为对应的指令请求,并将所述指令请求发送给服务器。结合第一方面第五种实现方式,本专利技术在第一方面的第六种实现方式中,所述语音解析步骤具体包括:获取当前页面参数,所述页面参数包括:当前页面展示内容、当前页面X、Y坐标以及当前屏幕大小;对页面展示的内容进行分词;根据所述页面参数和分词结果,将用户输入的语音转化为对应的指令。第二方面,本专利技术实施例提供了一种语音识别方法,包括以下步骤:指令获取步骤:获取与当前页面的业务信息相关联的指令;指令匹配步骤:接收由客户端发送的语音信息,并将该语音信息与所述指令进行匹配判断;指令执行步骤:若所述语音信息与所述指令相匹配,则执行所述指令操作,将指令执行结果发送至客户端显示。结合第二方面,本专利技术在第二方面的第一种实现方式中,所述指令获取步骤具体为:生成与当前页面的业务信息相关联的指令,并将所述指令发送至客户端。结合第二方面,本专利技术在第二方面的第二种实现方式中,所述指令获取步骤具体为:接收由客户端生成的与当前页面业务相关联的指令。第三方面,本专利技术实施例提供了一种语音识别装置,包括:第一指令获取单元,用于获取与当前页面的业务信息相关联的指令;第一指令匹配单元,用于接收用户输入的语音信息,判断所述语音信息是否与所述指令相匹配;第一指令执行单元,用于若所述语音信息与所述指令相匹配,则显示指令执行结果,同时启动语音交互模式。结合第三方面,本专利技术在第三方面的第一种实现方式中,所述第一指令获取单元具体用于接收由服务器生成的与当前页面的业务信息相关联的指令。结合第三方面,本专利技术在第三方面的第二种实现方式中,所述第一指令匹配单元具体用于将接收的语音信息发送至服务器进行比对判断。结合第三方面,本专利技术在第三方面的第三种实现方式中,所述装置还包括:语音解析单元,用于对用户输入的语音解析为对应的指令请求,并将所述指令请求发送服务器。结合第三方面的第三种实现方式,本专利技术在第三方面的第四种实现方式中,所述语音解析单元具体包括:页面参数获取模块,用于获取当前页面参数,所述页面参数包括:当前页面展示内容、当前页面X、Y坐标以及当前屏幕大小;分词模块,用于对页面展示的内容进行分词;指令转化模块,用于根据所述页面参数和分词结果,将用户输入的语音转化为对应的指令。第四方面,本专利技术实施例提供一种语音识别装置,包括:第二指令获取单元,用于获取与当前页面的业务信息相关联的指令;第二指令判断单元,用于接收由客户端发送的语音信息,并将该语音信息与所述指令进行匹配判断;第二指令匹配单元,用于若所述语音信息与所述指令相匹配,则执行所述指令操作,将指令执行结果发送至客户端显示。结合第四方面,本专利技术在第四方面的第一种实现方式为:所述指令获取单元生成与当前页面的业务信息相关联的指令,并将所述指令发送至客户端。结合第四方面,本专利技术在第四方面的第一种实现方式为:所述指令获取单元接收由客户端生成的与当前页面业务相关联的指令。所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,语音识别装置的结构中包括处理器和存储器,所述存储器用于存储支持语音识别装置执行上述第一方面和第二方面中语音识别方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述语音识别装置还可以包括通信接口,用于语音识别装置与其他设备或通信网络通信。第五方面,本专利技术实施例提供了一种计算机可读介质,用于存储语音识别装置所用的计算机软件指令,其包括用于执行上述第一方面中的语音识别方法为语音识别装置所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:通过采用动态生成的唤醒词,可以和具体的业务紧密结合,不需要用户特地用固定唤醒词开启语音业务,从而提高用户的体验。上述技术方案中的另一个技术方案具有如下优点或有益效果:可以实现全程语音操作,不用用户手动参与,操作上更加方便。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施例一的语音识别方法流程示意图;图2为本专利技术实施例一的步骤S140中具体步骤流程图;图3为本专利技术实施例四的语音识别方法流程示意图;图4为本专利技术实施例五的语音识别装置的连接框图;图5为本专利技术实施例五的语音解析单元内部连接框图;图6为本专利技术实施例六的语音识别装置的组成结构示意图;图7为本专利技术实施例七的语音识别设备的组成结构示意图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。本专利技术实施例旨在解决现有技术中需要使用按钮或者固定唤醒词的方式开启语音识别功能。本专利技术实施例主要通过采本文档来自技高网...
语音识别方法、装置、设备及计算机可读介质

【技术保护点】
一种语音识别方法,其特征在于,包括以下步骤:指令获取步骤:获取与当前页面的业务信息相关联的指令;指令匹配步骤:接收用户输入的语音信息,判断所述语音信息是否与所述指令相匹配;指令执行步骤:若所述语音信息与所述指令相匹配,则显示指令执行结果,同时启动语音交互模式。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括以下步骤:指令获取步骤:获取与当前页面的业务信息相关联的指令;指令匹配步骤:接收用户输入的语音信息,判断所述语音信息是否与所述指令相匹配;指令执行步骤:若所述语音信息与所述指令相匹配,则显示指令执行结果,同时启动语音交互模式。2.根据权利要求1所述语音识别方法,其特征在于,所述指令获取步骤具体为:接收由服务器生成的与当前页面的业务信息相关联的指令。3.根据权利要求1所述语音识别方法,其特征在于,所述指令获取步骤具体为:生成与当前页面的业务信息相关联的指令,并将所述指令发送至服务器。4.根据权利要求1所述语音识别方法,其特征在于,所述指令匹配步骤具体为:将接收的语音信息发送至服务器进行比对判断。5.根据权利要求1所述语音识别方法,其特征在于,所述指令匹配步骤具体为:对接收的语音信息进行比对判断,并将判断结果发送至服务器。6.根据权利要求1所述语音识别方法,其特征在于,所述指令执行步骤之后还包括语音解析步骤:对用户输入的语音解析为对应的指令请求,并将所述指令请求发送给服务器。7.根据权利要求6所述语音识别方法,其特征在于,所述语音解析步骤具体包括:获取当前页面参数,所述页面参数包括:当前页面展示内容、当前页面X、Y坐标以及当前屏幕大小;对页面展示的内容进行分词;根据所述页面参数和分词结果,将用户输入的语音转化为对应的指令。8.一种语音识别方法,其特征在于,包括以下步骤:指令获取步骤:获取与当前页面的业务信息相关联的指令;指令匹配步骤:接收由客户端发送的语音信息,并将该语音信息与所述指令进行匹配判断;指令执行步骤:若所述语音信息与所述指令相匹配,则执行所述指令操作,将指令执行结果发送至客户端显示。9.根据权利要求8所述语音识别方法,其特征在于,所述指令获取步骤具体为:生成与当前页面的业务信息相关联的指令,并将所述指令发送至客户端。10.根据权利要求8所述语音识别方法,其特征在于,所述指令获取步骤具体为:接收由客户端生成的与当前页面的业务信息相关联的指令。11.一种语音识别装置,其特征在于,包括:第一指令获取单元,用于获取与当前页面的业务信息相关...

【专利技术属性】
技术研发人员:刘俊启王磊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1