一种语音控制方法、装置、设备及存储介质制造方法及图纸

技术编号:21118010 阅读:21 留言:0更新日期:2019-05-16 09:41
本发明专利技术实施例提出一种语音控制方法、装置、设备及存储介质,其中方法包括:检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则对所述语音信息进行语音识别,得到所述语音信息对应的文本信息;针对所述文本信息执行对应的操作。本发明专利技术实施例能够简化与语音交互设备的交互流程,提高用户体验。

【技术实现步骤摘要】
一种语音控制方法、装置、设备及存储介质
本专利技术涉及语音交互
,尤其涉及一种语音控制方法、装置、设备及存储介质。
技术介绍
现有的语音交互技术中,用户在使用语音交互设备时,需要首先说出固定的唤醒词来唤醒设备,等待设备播报唤醒成功的提示后,再说出包含需求的语音指令。例如,某语音交互设备的唤醒词为“小A小A”。当用户需要语音交互设备播放音乐时,首先说出“小A小A”,等待语音交互设备播放“我来了”的语音信息。之后,用户再说出“我要听音乐”,语音交互设备对接收的语音信息进行语音识别,得到对应的文本信息,并针对该文本信息执行相应的操作。可见,现有的语音交互方式中,用户每发出一次指令都需要两轮交互。并且,用户需要掌握唤醒词并了解语音交互设备何时被唤醒成功,在等待唤醒成功的提示之后再说出相应的指令。这种方式费时费力,导致用户体验较差。
技术实现思路
本专利技术实施例提供一种语音控制方法及装置,以至少解决现有技术中的以上技术问题。第一方面,本专利技术实施例提供了一种语音控制方法,包括:检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则对所述语音信息进行语音识别,得到所述语音信息对应的文本信息;针对所述文本信息执行对应的操作。在一种实施方式中,所述检测语音信息的前多个音节中是否包含唤醒关键词,包括:采用预先设置的针对多个唤醒关键词的语音唤醒模型,检测所述语音信息的前多个音节中是否包含所述多个唤醒关键词中的任意一个唤醒关键词,如果是,则判定所述语音信息的前多个音节中包含唤醒关键词。在一种实施方式中,所述针对所述文本信息执行相应的处理,包括:判断所述文本信息是否为指令信息;如果是,则针对所述文本信息执行对应的操作。在一种实施方式中,所述判断所述文本信息是否为指令信息,包括:根据预设的唤醒关键词与指令判断策略的对应关系,获取所述语音信息中包含的唤醒关键词所对应的指令判断策略;采用获取的指令判断策略判断所述文本信息是否为指令信息。在一种实施方式中,所述语音唤醒模型设置于本地装置。在一种实施方式中,所述对所述语音信息进行语音识别,包括:采用设置于本地装置的语音识别模型对所述语音信息进行语音识别;或者,将所述语音信息发送至云端服务器,采用设置于云端服务器的语音识别模型对所述语音信息进行语音识别。第二方面,本专利技术实施例还提出一种语音控制装置,包括:检测模块,用于检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则指示识别模块进行识别;所述识别模块,用于根据所述检测模块的指示,对所述语音信息进行语音识别,得到所述语音信息对应的文本信息;操作模块,用于针对所述文本信息执行对应的操作。在一种实施方式中,所述检测模块用于,采用预先设置的针对多个唤醒关键词的语音唤醒模型,检测所述语音信息的前多个音节中是否包含所述多个唤醒关键词中的任意一个唤醒关键词,如果是,则判定所述语音信息的前多个音节中包含唤醒关键词。在一种实施方式中,所述操作模块包括:判断子模块,用于判断所述文本信息是否为指令信息;如果是,则指示执行子模块进行执行;所述执行子模块,用于根据所述判断子模块的指示,针对所述文本信息执行对应的操作。在一种实施方式中,所述判断子模块,用于根据预设的唤醒关键词与指令判断策略的对应关系,获取所述语音信息中包含的唤醒关键词所对应的指令判断策略;采用获取的指令判断策略判断所述文本信息是否为指令信息。在一种实施方式中,所述检测模块用于,采用设置于本地装置的语音唤醒模型进行检测。在一种实施方式中,所述识别模块用于,采用设置于本地装置的语音识别模型对所述语音信息进行语音识别;或者,将所述语音信息发送至云端服务器,采用设置于云端服务器的语音识别模型对所述语音信息进行语音识别。第三方面,本专利技术实施例提供了一种语音控制设备,所述设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,所述设备的结构中包括处理器和存储器,所述存储器用于存储支持所述设备执行上述语音控制方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口,用于与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储语音控制设备所用的计算机软件指令,其包括用于执行上述语音控制方法所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:本专利技术实施例提出的语音控制方法和装置,检测用户发出的语音信息的前多个音节中是否包含唤醒关键词,如果包含,则直接对语音信息的全部内容进行语音识别,并针对识别结果执行相应的操作。可见,采用本专利技术实施例,用户在说出作为指令的语音信息之前不需要单独说出唤醒词,也不需要等待唤醒成功,而是可以直接说出语音信息。因此本专利技术实施例可以简化与语音交互设备的交互流程,提高用户体验。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施例的一种语音控制方法实现流程图;图2为本专利技术实施例的一种语音控制方法中步骤S13的实现流程图;图3为本专利技术实施例的一种语音控制方法的应用实例一的流程图;图4为本专利技术实施例的一种语音控制方法的应用实例二的流程图;图5为本专利技术实施例的一种语音控制方法的应用实例三的流程图;图6为本专利技术实施例的一种语音控制装置的结构示意图;图7为本专利技术实施例的一种语音控制装置的结构示意图;图8为本专利技术实施例的一种语音控制设备的结构示意图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。本专利技术实施例主要提供了语音控制方法和装置,下面分别通过以下实施例进行技术方案的展开描述。本专利技术实施例提出的语音控制方法可以应用于语音交互设备,并且语音交互设备在执行该方法之前,可以处于任意状态。当语音交互设备接收到用户发出的语音信息时,执行本专利技术实施例提出的语音控制方法。如图1为本专利技术实施例的一种语音控制方法实现流程图,该方法包括:S11:检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则执行步骤S12;S12:对语音信息进行语音识别,得到语音信息对应的文本信息;S13:针对文本信息执行对应的操作。在一种可能的实施方式中,上述唤醒关键词可以针对不同的应用场景,并根据用户在不同应用场景下语音指令的前几个惯用字进行设置。例如,针对导航场景,可以设置唤醒关键词为“导航到”或“我要去”;针对音频播放场景,可以设置唤醒关键词为“我要听”;针对拨打电话场景,可以设置唤醒关键词为“打电话给”。语音交互设备接收到语音信息之后,如果检测到语音信息中的前几个音节中包含唤醒关键词,则继续对该语音信息的全部内容进行语音识别,得到对应的文本文档来自技高网...

【技术保护点】
1.一种语音控制方法,其特征在于,包括:检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则对所述语音信息进行语音识别,得到所述语音信息对应的文本信息;针对所述文本信息执行对应的操作。

【技术特征摘要】
1.一种语音控制方法,其特征在于,包括:检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则对所述语音信息进行语音识别,得到所述语音信息对应的文本信息;针对所述文本信息执行对应的操作。2.根据权利要求1所述的方法,其特征在于,所述检测语音信息的前多个音节中是否包含唤醒关键词,包括:采用预先设置的针对多个唤醒关键词的语音唤醒模型,检测所述语音信息的前多个音节中是否包含所述多个唤醒关键词中的任意一个唤醒关键词,如果是,则判定所述语音信息的前多个音节中包含唤醒关键词。3.根据权利要求1或2所述的方法,其特征在于,所述针对所述文本信息执行相应的处理,包括:判断所述文本信息是否为指令信息;如果是,则针对所述文本信息执行对应的操作。4.根据权利要求3所述的方法,其特征在于,所述判断所述文本信息是否为指令信息,包括:根据预设的唤醒关键词与指令判断策略的对应关系,获取所述语音信息中包含的唤醒关键词所对应的指令判断策略;采用获取的指令判断策略判断所述文本信息是否为指令信息。5.根据权利要求2所述的方法,其特征在于,所述语音唤醒模型设置于本地装置。6.根据权利要求1所述的方法,其特征在于,所述对所述语音信息进行语音识别,包括:采用设置于本地装置的语音识别模型对所述语音信息进行语音识别;或者,将所述语音信息发送至云端服务器,采用设置于云端服务器的语音识别模型对所述语音信息进行语音识别。7.一种语音控制装置,其特征在于,包括:检测模块,用于检测语音信息的前多个音节中是否包含唤醒关键词;如果包含,则指示识别模块进行识别;所述识别模块,用于根据所述检测模块的指示,对所述语音信息进行语音识别,得到所述语音信息...

【专利技术属性】
技术研发人员:唐丹丹
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1