The invention provides an off-line speech recognition method and device, which includes: controlling the current working state to enter the command wake-up state; matching the current voice information with the pre-stored voice standard instruction when receiving the current voice information, and calculating the matching degree; searching the current voice information matching with the current voice information when the matching degree is not less than the preset matching threshold. Standard play voice and broadcast the current standard play voice; convert the command wake-up state to confirmation wake-up state; when receiving the next voice information corresponding to the current voice information, judge whether the next voice information contains confirmation words, and if so, execute the operation instructions corresponding to the current standard play voice. The scheme provided by the invention can effectively improve the accuracy of off-line speech recognition.
【技术实现步骤摘要】
一种离线语音识别方法和装置
本专利技术涉及语音识别
,特别涉及一种离线语音识别方法和装置。
技术介绍
随着移动互联网和人工智能的发展,语音识别技术逐渐成为人机交互领域最重要的技术之一。离线语音识别是通过在设备或软件中预置命令词,当用户发出语音指令时,设备便按照语音指令执行相应动作。目前,离线语音识别的方式主要是,降噪、回声消除,将语音指令与存储的语音标准指令进行对比,按照相匹配的语音标准指令,直接执行该语音标准指令。而语音指令与语音标准指令在匹配过程中,由于操作者口音问题等原因,造成匹配错误,直接影响语音识别的准确率。
技术实现思路
本专利技术实施例提供了一种离线语音识别方法和装置,能够有效地提高离线语音识别的准确性。一种离线语音识别方法,包括:控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将所述当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当所述匹配度不小于预设的匹配阈值时,查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音;将所述指令唤醒状态转换为确认唤醒状态;在接收到所述当前语音信息对应的下一条语音信息时,判断所述下一条语音信息是否包含有确认词,如果是,则执行所述当前标准播放语音对应的操作指令。优选地,在所述控制当前状态进入指令唤醒状态之后,在所述接收到当前语音信息之前,进一步包括:在所述指令唤醒状态持续时长达到预设的时长阈值时,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。优选地,在所述控制所述指令唤醒状态转换为确认唤醒状态之后,在所述接收到所述当前语音信息对应的下一条语音信息之前,进一步 ...
【技术保护点】
1.一种离线语音识别方法,其特征在于,包括:控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将所述当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当所述匹配度不小于预设的匹配阈值时,查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音;将所述指令唤醒状态转换为确认唤醒状态;在接收到所述当前语音信息对应的下一条语音信息时,判断所述下一条语音信息是否包含有确认词,如果是,则执行所述当前标准播放语音对应的操作指令。
【技术特征摘要】
1.一种离线语音识别方法,其特征在于,包括:控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将所述当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当所述匹配度不小于预设的匹配阈值时,查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音;将所述指令唤醒状态转换为确认唤醒状态;在接收到所述当前语音信息对应的下一条语音信息时,判断所述下一条语音信息是否包含有确认词,如果是,则执行所述当前标准播放语音对应的操作指令。2.根据权利要求1所述的离线语音识别方法,其特征在于,在所述控制当前状态进入指令唤醒状态之后,在所述接收到当前语音信息之前,进一步包括:在所述指令唤醒状态持续时长达到预设的时长阈值时,清除与所述当前语音信息相关的记录信息,并转换为休眠状态;和/或,在所述控制所述指令唤醒状态转换为确认唤醒状态之后,在所述接收到所述当前语音信息对应的下一条语音信息之前,进一步包括:在所述确认唤醒状态持续时长达到预设的时长阈值时,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。3.根据权利要求1所述的离线语音识别方法,其特征在于,在所述计算匹配度之后,进一步包括:当所述匹配度小于预设的匹配阈值时,给出操作失败的语音提示,清除与所述当前语音信息相关的记录信息,并转换为休眠状态;和/或,进一步包括:当所述下一条语音信息不包含确认词时,给出操作失败的语音提示,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。4.根据权利要求1所述的离线语音识别方法,其特征在于,进一步包括:在当前工作状态为休眠状态时,接收到语音唤醒词,则执行所述控制当前工作状态进入指令唤醒状态;或者,在当前工作状态为休眠状态时,接收到唤醒触发信号,则执行所述控制当前工作状态进入指令唤醒状态。5.根据权利要求1所述的离线语音识别方法,其特征在于,所述语音标准指令,包括:多个调控动作词组、多个调控参数词组以及多个调控指标词组;所述将所述当前语音信息与预存储的语音标准指令进行匹配,包括:将所述当前语音信息转换为对应的调控文本;对所述调控文本进行分词;将分词结果中的各个实体词分别与所述调控动作词组、调控参数词组以及调控指标词组进行匹配。6.根据权利要求5所述的离线语音识别方法,其特征在于,进一步包括:预先为所述调控动作词组、所述调控参数词组以及所述调控指标词组存储对应的语音播放文件;所述查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音,包括:确定与所述各个实体词相匹配的目标调控动作词组、目标调控参数词组以及目标调控指标词组;按照预设的调控参数-调控动作-调控指标的播放顺序,顺次播放所述目标调控参数词组对应的语音播放文件、所述目标调控动作词组对应的语音播放文件以及所述目...
【专利技术属性】
技术研发人员:文俊,刘皓,叶莉,
申请(专利权)人:四川虹美智能科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。