基于人工智能的语音唤醒方法和装置制造方法及图纸

技术编号:15507920 阅读:207 留言:0更新日期:2017-06-04 02:24
本发明专利技术提出一种基于人工智能的语音唤醒方法和装置,该基于人工智能的语音唤醒方法包括获取用户输入的语音,并在判定对终端唤醒成功之后,获取将终端唤醒的时间点;获取时间点前后第一预设时间范围之内语音的数据帧的识别文本;从识别文本中提取目标文本,并通过目标文本对用户输入的语音进行处理。通过本发明专利技术能够优化语音唤醒处理过程,实现连续地语音唤醒识别,有效提升语音唤醒识别效率。

Method and device for voice wakeup based on Artificial Intelligence

The invention provides a method and device for voice wake based on artificial intelligence, the wake-up speech based on artificial intelligence methods including voice get user input, and in the judgment on the terminal after wake up successfully, will obtain terminal wake-up time; access time points before and after the first preset identification text time range data frames of speech; the extraction of target text from text recognition, and the target text to speech user input processing. The invention can optimize the process of speech wakeup, realize continuous voice wakeup recognition, and effectively improve the efficiency of voice wakeup recognition.

【技术实现步骤摘要】
基于人工智能的语音唤醒方法和装置
本专利技术涉及语音识别
,尤其涉及一种基于人工智能的语音唤醒方法和装置。
技术介绍
语音唤醒技术是语音识别技术中的重要分支,语音唤醒技术通过监听用户语音来判断用户是否说出了指定唤醒词来启动设备。目前在车载、导航,以及智能家居等方面有着重要的应用,用于用声音启动程序或者服务。人工智能(ArtificialIntelligence,AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。相关技术中,通过在终端的后台运行一个唤醒模块,唤醒模块可以在离线状态下不断循环判断用户是否输入语音,当确定用户输入匹配的语音时,则开始启动语音识别,然后持续进行检测,在用户停止录入语音后,将识别到的语音的数据帧发送至服务器以启动程序或者服务。这种方式下,在通过匹配的语音进行唤醒的过程中,需要两次问答才能够启动程序或者服务,语音唤醒识别效率不佳。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于人工智能的语音唤醒方法,能够优化语音唤醒处理过程,实现连续地语音唤醒识别,有效提升语音唤醒识别效率。本专利技术的另一个目的在于提出一种基于人工智能的语音唤醒装置。本专利技术的又一个目的在于提出一种基于人工智能的语音唤醒装置。本专利技术的另一个目的在于提出一种非临时性计算机可读存储介质。本专利技术的另一个目的在于提出一种计算机程序产品。为达到上述目的,本专利技术第一方面实施例提出的基于人工智能的语音唤醒方法,包括:获取用户输入的语音,并在判定对终端唤醒成功之后,获取将所述终端唤醒的时间点;获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本;从所述识别文本中提取目标文本,并通过所述目标文本对所述用户输入的语音进行处理。本专利技术第一方面实施例提出的基于人工智能的语音唤醒方法,通过本实施例中,通过获取用户输入的语音,并在判定对终端唤醒成功之后,获取将终端唤醒的时间点,获取时间点前后第一预设时间范围之内语音的数据帧的识别文本,以及从识别文本中提取目标文本,并通过目标文本对用户输入的语音进行处理,由于是从识别文本中提取目标文本,而不是二次接收用户输入的语音,优化了语音唤醒处理过程,实现连续地语音唤醒识别,有效提升语音唤醒识别效率。为达到上述目的,本专利技术第二方面实施例提出的基于人工智能的语音唤醒装置,包括:第一获取模块,用于获取用户输入的语音,并在判定对终端唤醒成功之后,获取将所述终端唤醒的时间点;第二获取模块,用于获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本;识别处理模块,用于从所述识别文本中提取目标文本,并通过所述目标文本对所述用户输入的语音进行处理。本专利技术第二方面实施例提出的基于人工智能的语音唤醒装置,通过获取用户输入的语音,并在判定对终端唤醒成功之后,获取将终端唤醒的时间点,获取时间点前后第一预设时间范围之内语音的数据帧的识别文本,以及从识别文本中提取目标文本,并通过目标文本对用户输入的语音进行处理,由于是从识别文本中提取目标文本,而不是二次接收用户输入的语音,优化了语音唤醒处理过程,实现连续地语音唤醒识别,有效提升语音唤醒识别效率。为达到上述目的,本专利技术第三方面实施例提出的基于人工智能的语音唤醒装置,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取用户输入的语音,并在判定对终端唤醒成功之后,获取将所述终端唤醒的时间点;获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本;从所述识别文本中提取目标文本,并通过所述目标文本对所述用户输入的语音进行处理。本专利技术第三方面实施例提出的基于人工智能的语音唤醒装置,通过获取用户输入的语音,并在判定对终端唤醒成功之后,获取将终端唤醒的时间点,获取时间点前后第一预设时间范围之内语音的数据帧的识别文本,以及从识别文本中提取目标文本,并通过目标文本对用户输入的语音进行处理,由于是从识别文本中提取目标文本,而不是二次接收用户输入的语音,优化了语音唤醒处理过程,实现连续地语音唤醒识别,有效提升语音唤醒识别效率。为达到上述目的,本专利技术第四方面实施例提出的非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器被执行时,使得移动终端能够执行一种基于人工智能的语音唤醒方法,所述方法包括:获取用户输入的语音,并在判定对终端唤醒成功之后,获取将所述终端唤醒的时间点;获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本;从所述识别文本中提取目标文本,并通过所述目标文本对所述用户输入的语音进行处理。本专利技术第四方面实施例提出的非临时性计算机可读存储介质,通过获取用户输入的语音,并在判定对终端唤醒成功之后,获取将终端唤醒的时间点,获取时间点前后第一预设时间范围之内语音的数据帧的识别文本,以及从识别文本中提取目标文本,并通过目标文本对用户输入的语音进行处理,由于是从识别文本中提取目标文本,而不是二次接收用户输入的语音,优化了语音唤醒处理过程,实现连续地语音唤醒识别,有效提升语音唤醒识别效率。为达到上述目的,本专利技术第五方面实施例提出的计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的语音唤醒方法,所述方法包括:获取用户输入的语音,并在判定对终端唤醒成功之后,获取将所述终端唤醒的时间点;获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本;从所述识别文本中提取目标文本,并通过所述目标文本对所述用户输入的语音进行处理。本专利技术第五方面实施例提出的计算机程序产品,通过获取用户输入的语音,并在判定对终端唤醒成功之后,获取将终端唤醒的时间点,获取时间点前后第一预设时间范围之内语音的数据帧的识别文本,以及从识别文本中提取目标文本,并通过目标文本对用户输入的语音进行处理,由于是从识别文本中提取目标文本,而不是二次接收用户输入的语音,优化了语音唤醒处理过程,实现连续地语音唤醒识别,有效提升语音唤醒识别效率。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的基于人工智能的语音唤醒方法的流程示意图;图2是本专利技术另一实施例提出的基于人工智能的语音唤醒方法的流程示意图;图3是本专利技术另一实施例提出的基于人工智能的语音唤醒装置的结构示意图;图4是本专利技术另一实施例提出的基于人工智能的语音唤醒装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本专利技术一实施本文档来自技高网...
基于人工智能的语音唤醒方法和装置

【技术保护点】
一种基于人工智能的语音唤醒方法,其特征在于,包括以下步骤:获取用户输入的语音,并在判定对终端唤醒成功之后,获取将所述终端唤醒的时间点;获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本;从所述识别文本中提取目标文本,并通过所述目标文本对所述用户输入的语音进行处理。

【技术特征摘要】
1.一种基于人工智能的语音唤醒方法,其特征在于,包括以下步骤:获取用户输入的语音,并在判定对终端唤醒成功之后,获取将所述终端唤醒的时间点;获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本;从所述识别文本中提取目标文本,并通过所述目标文本对所述用户输入的语音进行处理。2.如权利要求1所述的基于人工智能的语音唤醒方法,其特征在于,所述获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本,包括:将所述终端切换至连续唤醒模式之后,获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本。3.如权利要求2所述的基于人工智能的语音唤醒方法,其特征在于,所述将所述终端切换至连续唤醒模式,包括:在获取将所述终端唤醒的时间点之后,对所述终端的麦克风持续进行语音信号检测;判断在所述时间点之后的第二预设时间范围之内是否检测到所述语音信号;在检测到所述语音信号时,将所述终端切换至所述连续唤醒模式。4.如权利要求1所述的基于人工智能的语音唤醒方法,其特征在于,所述从所述识别文本中提取目标文本,包括:从所述识别文本中识别出唤醒词;将所述唤醒词从所述识别文本中删除,并将删除后的识别文本作为目标文本。5.如权利要求3所述的基于人工智能的语音唤醒方法,其特征在于,所述判断在所述时间点之后的第二预设时间范围之内是否检测到所述语音信号之后,还包括:在未检测到所述语音信号时,将所述终端切换至非连续唤醒模式。6.如权利要求5所述的基于人工智能的语音唤醒方法,其特征在于,所述将所述终端切换至非连续唤醒模式之后,还包括:生成用于提示用户所述终端已被唤醒的信息,并根据所述信息对所述用户进行提示。7.如权利要求1所述的基于人工智能的语音唤醒方法,其特征在于,所述通过所述目标文本对所述用户输入的语音进行处理,包括:根据所述目标文本生成处理请求;将所述处理请求发送至语音服务器,以使所述语音服务器根据所述...

【专利技术属性】
技术研发人员:李哲浩
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1