应用程序的语音控制方法和装置制造方法及图纸

技术编号:18499408 阅读:91 留言:0更新日期:2018-07-21 21:18
本申请实施例公开了应用程序的语音控制方法和装置。该方法的一具体实施方式包括:接收用户输入的语音信息,将语音信息转化为文本信息;响应于确定出文本信息中包括目标应用程序的标识词,从文本信息中获取至少一个目标关键词,并在预设的指令集中匹配所获取的目标关键词,其中,指令集包括多个关键词和与关键词绑定的指令;响应于从预设的指令集中匹配到目标关键词,获取与目标关键词绑定的指令,控制目标应用程序根据所获取的指令进行运行。该实施方式降低了目标应用程序的操作复杂程度。

The voice control method and device of the application

The application embodiment discloses a voice control method and device for an application. A specific implementation of the method includes receiving the input of the voice information from the user, converting the speech information into text information, responding to identifying the identifier of the target application in the text information, obtaining at least one target keyword from the text information, and matching the acquired target in the preset instruction set. Key words, in which the instruction set includes multiple keywords and instructions bound to the key words; the response is to match the target keyword from the preset instruction set to the target keyword, and the control target application runs according to the instructions obtained. This implementation reduces the complexity of the target application.

【技术实现步骤摘要】
应用程序的语音控制方法和装置
本申请实施例涉及计算机
,具体涉及应用程序的语音控制方法和装置。
技术介绍
目前,终端设备上安装的应用层出不穷,为了尽可能满足用户的多方面需求,许多应用集各种功能于一身。而这些多且复杂的功能不可避免地会导致用户操作不便。例如,购物平台类应用程序、搜索类工具应用程序、网络运营商客户端等通常会提供多种应用功能。这些应用程序中,某些功能或者设置选项可能需要用户多次点击、逐层进入子界面之后才能发现。另外,即使用户知道某个“深层”功能所在的位置,每次使用该功能之前还是需要多级点击跳转。
技术实现思路
本申请实施例提出了应用程序的语音控制方法和装置。第一方面,本申请实施例提供了一种应用程序的语音控制方法,该方法包括:接收用户输入的语音信息,将语音信息转化为文本信息;响应于确定出文本信息中包括目标应用程序的标识词,从文本信息中获取至少一个目标关键词,并在预设的指令集中匹配所获取的目标关键词,其中,指令集包括多个关键词和与关键词绑定的指令;响应于从预设的指令集中匹配到目标关键词,获取与目标关键词绑定的指令,控制目标应用程序根据所获取的指令进行运行。在一些实施例中,在接收用户输入的语音信息之前,方法还包括:响应于接收到目标应用程序的打开指令,启动该目标应用程序以调用语音识别接口。在一些实施例中,标识词位于文本信息所组成的字符串的预设位置。在一些实施例中,方法还包括:为目标应用程序设置对应的标识词;以及获取构成目标应用程序的至少一个指令,为指令绑定用于触发该指令的至少一个关键词,形成预设的指令集。在一些实施例中,方法还包括:向用户发送与目标关键词所绑定的指令的运行结果。第二方面,本申请实施例提供了一种应用程序的语音控制装置,装置包括:转化单元,配置用于接收用户输入的语音信息,将语音信息转化为文本信息;匹配单元,配置用于响应于确定出文本信息中包括目标应用程序的标识词,从文本信息中获取至少一个目标关键词,并在预设的指令集中匹配所获取的目标关键词,其中,指令集包括多个关键词和与关键词绑定的指令;控制单元,配置用于响应于从预设的指令集中匹配到目标关键词,获取与目标关键词绑定的指令,控制目标应用程序根据所获取的指令进行运行。在一些实施例中,装置还包括:调用单元,配置用于响应于接收到目标应用程序的打开指令,启动该目标应用程序以调用语音识别接口。在一些实施例中,标识词位于文本信息所组成的字符串的预设位置。在一些实施例中,装置还包括:设置单元,配置用于为目标应用程序设置对应的标识词;以及指令集形成单元,配置用于获取构成目标应用程序的至少一个指令,为指令绑定用于触发该指令的至少一个关键词,形成预设的指令集。在一些实施例中,装置还包括:发送单元,配置用于向用户发送与目标关键词所绑定的指令的运行结果。本申请实施例提供的应用程序的语音控制方法和装置,可以将接收到的用户输入的语音信息转化为文本信息,而后响应于确定出文本信息中包括目标应用程序的标识词,可以从该文本信息中获取至少一个目标关键词,并在预设的指令集中匹配所获取的目标关键词,最后响应于从预设的指令集中匹配到目标关键词,可以获取与目标关键词绑定的指令,并控制目标应用程序根据所获取的指令进行运行,从而实现对目标应用程序的语音控制,降低了目标应用程序的操作复杂程度。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的应用程序的语音控制方法的一个实施例的流程图;图3是根据本申请的应用程序的语音控制方法的另一个实施例的流程图;图4是根据本申请的应用程序的语音控制方法的一个应用场景的示意图;图5是根据本申请的应用程序的语音控制装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的应用程序的语音控制方法或应用程序的语音控制装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送信息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如搜索类应用、购物类应用、天气类应用、即时通信工具、邮箱客户端、社交平台软件等。终端设备101、102、103可以是具有显示屏并且支持语音输入的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上输入的语音信息进行识别和转化的后台服务器。后台服务器可以对接收到的语音信息等进行信息转化、匹配、搜索等处理,并将处理结果(例如搜索结果页面)反馈给终端设备。需要说明的是,本申请实施例所提供的应用程序的语音控制方法一般由服务器105执行,相应地,应用程序的语音控制装置一般设置于服务器105中。还需要指出的是,应用程序的语音控制方法也可以由终端设备101、102、103执行,相应地,应用程序的语音控制装置也可以设置于终端设备101、102、103中。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。继续参考图2,示出了根据本申请的应用程序的语音控制方法的一个实施例的流程200。该应用程序的语音控制方法,包括以下步骤:步骤201,接收用户输入的语音信息,将语音信息转化为文本信息。在本实施例中,应用程序的语音控制方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式从安装有应用程序的终端设备(例如图1所示的终端设备101、102、103)接收用户输入的语音信息。而后,该电子设备可以利用各种手段对所接到的语音信息进行文本转化以生成与该语音信息对应的文本信息。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultrawideband)连接、以及其他现在已知或将来开发的无线连接方式。作为示例,可以利用大量的语音信息和语音信息对应的文本信息来训练声学模型(比如隐马尔可夫模型),本文档来自技高网...

【技术保护点】
1.一种应用程序的语音控制方法,包括:接收用户输入的语音信息,将所述语音信息转化为文本信息;响应于确定出所述文本信息中包括目标应用程序的标识词,从所述文本信息中获取至少一个目标关键词,并在预设的指令集中匹配所获取的目标关键词,其中,所述指令集包括多个关键词和与关键词绑定的指令;响应于从预设的所述指令集中匹配到所述目标关键词,获取与所述目标关键词绑定的指令,控制所述目标应用程序根据所获取的指令进行运行。

【技术特征摘要】
1.一种应用程序的语音控制方法,包括:接收用户输入的语音信息,将所述语音信息转化为文本信息;响应于确定出所述文本信息中包括目标应用程序的标识词,从所述文本信息中获取至少一个目标关键词,并在预设的指令集中匹配所获取的目标关键词,其中,所述指令集包括多个关键词和与关键词绑定的指令;响应于从预设的所述指令集中匹配到所述目标关键词,获取与所述目标关键词绑定的指令,控制所述目标应用程序根据所获取的指令进行运行。2.根据权利要求1所述的方法,其中,在接收用户输入的语音信息之前,所述方法还包括:响应于接收到所述目标应用程序的打开指令,启动该目标应用程序以调用语音识别接口。3.根据权利要求1所述的方法,其中,所述标识词位于所述文本信息所组成的字符串的预设位置。4.根据权利要求1所述的方法,其中,所述方法还包括:为所述目标应用程序设置对应的标识词;以及获取构成所述目标应用程序的至少一个指令,为所述指令绑定用于触发该指令的至少一个关键词,形成预设的所述指令集。5.根据权利要求1-4之一所述的方法,其中,所述方法还包括:向所述用户发送与所述目标关键词所绑定的指令的运行结果。6.一种应用程序的语音控制装置,包括:转化单元,配置用于接收用户输入的语音信息,将所述语音信息转化为文本信息;匹配单元,配置用于响应于确定出所述文本信息中包括目标应用程序的标识词,从所述文本信息中获取至少一个...

【专利技术属性】
技术研发人员:郭弘毅
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1