基于人工智能的语音唤醒方法和装置制造方法及图纸

技术编号：15507920 阅读：207 留言：0更新日期：2017-06-04 02:24

本发明专利技术提出一种基于人工智能的语音唤醒方法和装置，该基于人工智能的语音唤醒方法包括获取用户输入的语音，并在判定对终端唤醒成功之后，获取将终端唤醒的时间点；获取时间点前后第一预设时间范围之内语音的数据帧的识别文本；从识别文本中提取目标文本，并通过目标文本对用户输入的语音进行处理。通过本发明专利技术能够优化语音唤醒处理过程，实现连续地语音唤醒识别，有效提升语音唤醒识别效率。

Method and device for voice wakeup based on Artificial Intelligence

The invention provides a method and device for voice wake based on artificial intelligence, the wake-up speech based on artificial intelligence methods including voice get user input, and in the judgment on the terminal after wake up successfully, will obtain terminal wake-up time; access time points before and after the first preset identification text time range data frames of speech; the extraction of target text from text recognition, and the target text to speech user input processing. The invention can optimize the process of speech wakeup, realize continuous voice wakeup recognition, and effectively improve the efficiency of voice wakeup recognition.

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能的语音唤醒方法和装置
本专利技术涉及语音识别
，尤其涉及一种基于人工智能的语音唤醒方法和装置。
技术介绍
语音唤醒技术是语音识别技术中的重要分支，语音唤醒技术通过监听用户语音来判断用户是否说出了指定唤醒词来启动设备。目前在车载、导航，以及智能家居等方面有着重要的应用，用于用声音启动程序或者服务。人工智能(ArtificialIntelligence，AI)，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。相关技术中，通过在终端的后台运行一个唤醒模块，唤醒模块可以在离线状态下不断循环判断用户是否输入语音,当确定用户输入匹配的语音时,则开始启动语音识别,然后持续进行检测，在用户停止录入语音后,将识别到的语音的数据帧发送至服务器以启动程序或者服务。这种方式下，在通过匹配的语音进行唤醒的过程中，需要两次问答才能够启动程序或者服务，语音唤醒识别效率不佳。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的一个目的在于提出一种基于人工智能的语音唤醒方法，能够优化语音唤醒处理过程，实现连续地语音唤醒识别，有效提升语音唤醒识别效率。本专利技术的另一个目的在于提出一种基于人工智能的语音唤醒装置。本专利技术的又一个目的在于提出一种基于人工智能的语音唤醒装置。本专利技术的另一个目的在于提出一种非临时性计算...
基于人工智能的语音唤醒方法和装置

【技术保护点】
一种基于人工智能的语音唤醒方法，其特征在于，包括以下步骤：获取用户输入的语音，并在判定对终端唤醒成功之后，获取将所述终端唤醒的时间点；获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本；从所述识别文本中提取目标文本，并通过所述目标文本对所述用户输入的语音进行处理。

【技术特征摘要】
1.一种基于人工智能的语音唤醒方法，其特征在于，包括以下步骤：获取用户输入的语音，并在判定对终端唤醒成功之后，获取将所述终端唤醒的时间点；获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本；从所述识别文本中提取目标文本，并通过所述目标文本对所述用户输入的语音进行处理。2.如权利要求1所述的基于人工智能的语音唤醒方法，其特征在于，所述获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本，包括：将所述终端切换至连续唤醒模式之后，获取所述时间点前后第一预设时间范围之内所述语音的数据帧的识别文本。3.如权利要求2所述的基于人工智能的语音唤醒方法，其特征在于，所述将所述终端切换至连续唤醒模式，包括：在获取将所述终端唤醒的时间点之后，对所述终端的麦克风持续进行语音信号检测；判断在所述时间点之后的第二预设时间范围之内是否检测到所述语音信号；在检测到所述语音信号时，将所述终端切换至所述连续唤醒模式。4.如权利要求1所述的基于人工智能的语音唤醒方法，其特征在于，所述从所述识别文本中提取目标文本，包括：从所述识别文本中识别出唤醒词；将所述唤醒词从所述识别文本中删除，并将删除后的识别文本作为目标文本。5.如权利要求3所述的基于人工智能的语音唤醒方法，其特征在于，所述判断在所述时间点之后的第二预设时间范围之内是否检测到所述语音信号之后，还包括：在未检测到所述语音信号时，将所述终端切换至非连续唤醒模式。6.如权利要求5所述的基于人工智能的语音唤醒方法，其特征在于，所述将所述终端切换至非连续唤醒模式之后，还包括：生成用于提示用户所述终端已被唤醒的信息，并根据所述信息对所述用户进行提示。7.如权利要求1所述的基于人工智能的语音唤醒方法，其特征在于，所述通过所述目标文本对所述用户输入的语音进行处理，包括：根据所述目标文本生成处理请求；将所述处理请求发送至语音服务器，以使所述语音服务器根据所述...

【专利技术属性】
技术研发人员：李哲浩，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人