一种离线语音识别方法和装置制造方法及图纸

技术编号:21226472 阅读:24 留言:0更新日期:2019-05-29 07:16
本发明专利技术提供了一种离线语音识别方法和装置,该方法包括:控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当匹配度不小于预设的匹配阈值时,查找与当前语音信息相匹配的当前标准播放语音,并播报当前标准播放语音;将指令唤醒状态转换为确认唤醒状态;在接收到当前语音信息对应的下一条语音信息时,判断下一条语音信息是否包含有确认词,如果是,则执行当前标准播放语音对应的操作指令。本发明专利技术提供的方案能够有效地提高离线语音识别的准确性。

An Offline Speech Recognition Method and Device

The invention provides an off-line speech recognition method and device, which includes: controlling the current working state to enter the command wake-up state; matching the current voice information with the pre-stored voice standard instruction when receiving the current voice information, and calculating the matching degree; searching the current voice information matching with the current voice information when the matching degree is not less than the preset matching threshold. Standard play voice and broadcast the current standard play voice; convert the command wake-up state to confirmation wake-up state; when receiving the next voice information corresponding to the current voice information, judge whether the next voice information contains confirmation words, and if so, execute the operation instructions corresponding to the current standard play voice. The scheme provided by the invention can effectively improve the accuracy of off-line speech recognition.

【技术实现步骤摘要】
一种离线语音识别方法和装置
本专利技术涉及语音识别
,特别涉及一种离线语音识别方法和装置。
技术介绍
随着移动互联网和人工智能的发展,语音识别技术逐渐成为人机交互领域最重要的技术之一。离线语音识别是通过在设备或软件中预置命令词,当用户发出语音指令时,设备便按照语音指令执行相应动作。目前,离线语音识别的方式主要是,降噪、回声消除,将语音指令与存储的语音标准指令进行对比,按照相匹配的语音标准指令,直接执行该语音标准指令。而语音指令与语音标准指令在匹配过程中,由于操作者口音问题等原因,造成匹配错误,直接影响语音识别的准确率。
技术实现思路
本专利技术实施例提供了一种离线语音识别方法和装置,能够有效地提高离线语音识别的准确性。一种离线语音识别方法,包括:控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将所述当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当所述匹配度不小于预设的匹配阈值时,查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音;将所述指令唤醒状态转换为确认唤醒状态;在接收到所述当前语音信息对应的下一条语音信息时,判断所述下一条语音信息是否包含有确认词,如果是,则执行所述当前标准播放语音对应的操作指令。优选地,在所述控制当前状态进入指令唤醒状态之后,在所述接收到当前语音信息之前,进一步包括:在所述指令唤醒状态持续时长达到预设的时长阈值时,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。优选地,在所述控制所述指令唤醒状态转换为确认唤醒状态之后,在所述接收到所述当前语音信息对应的下一条语音信息之前,进一步包括:在所述确认唤醒状态持续时长达到预设的时长阈值时,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。优选地,在所述计算匹配度之后,进一步包括:当所述匹配度小于预设的匹配阈值时,给出操作失败的语音提示,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。优选地,上述离线语音识别方法进一步包括:当所述下一条语音信息不包含确认词时,给出操作失败的语音提示,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。优选地,上述离线语音识别方法进一步包括:在当前工作状态为休眠状态时,接收到语音唤醒词,则执行所述控制当前工作状态进入指令唤醒状态。优选地,上述离线语音识别方法进一步包括:在当前工作状态为休眠状态时,接收到唤醒触发信号,则执行所述控制当前工作状态进入指令唤醒状态。优选地,所述语音标准指令,包括:多个调控动作词组、多个调控参数词组以及多个调控指标词组;所述将所述当前语音信息与预存储的语音标准指令进行匹配,包括:将所述当前语音信息转换为对应的调控文本;对所述调控文本进行分词;将分词结果中的各个实体词分别与所述调控动作词组、调控参数词组以及调控指标词组进行匹配。优选地,上述离线语音识别方法进一步包括:预先为所述调控动作词组、所述调控参数词组以及所述调控指标词组存储对应的语音播放文件;所述查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音,包括:确定与所述各个实体词相匹配的目标调控动作词组、目标调控参数词组以及目标调控指标词组;按照预设的调控参数-调控动作-调控指标的播放顺序,顺次播放所述目标调控参数词组对应的语音播放文件、所述目标调控动作词组对应的语音播放文件以及所述目标调控指标词组对应的语音播放文件。优选地,所述计算匹配度,包括:根据下述匹配度计算公式,计算所述匹配度;其中,ω表征匹配度;ai表征第i个实体词与调控参数词组最大重合字数;Ai表征与第i个实体词具有最大重合字数的调控参数词组的字数;bi表征第i个实体词与调控动作词组最大重合字数;Bi表征与第i个实体词具有最大重合字数的调控动作词组的字数;ci表征第i个实体词与调控指标词组最大重合字数;Ci表征与第i个实体词具有最大重合字数的调控指标词组的字数;n表征实体词的总个数。一种离线语音识别装置,包括:指令处理单元和确认处理单元,其中,所述指令处理单元,用于控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将所述当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当所述匹配度不小于预设的匹配阈值时,查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音,并触发所述确认处理单元;所述确认处理单元,用于在所述指令处理单元的触发时,将所述指令唤醒状态转换为确认唤醒状态;在接收到所述当前语音信息对应的下一条语音信息时,判断所述下一条语音信息是否包含有确认词,如果是,则执行所述当前标准播放语音。优选地,上述离线语音识别装置,进一步包括:存储单元,其中,所述存储单元,用于预先存储多个调控动作词组、多个调控参数词组以及多个调控指标词组;所述指令处理单元,进一步用于将所述当前语音信息转换为对应的调控文本;对所述调控文本进行分词;将分词结果中的各个实体词分别与所述调控动作词组、调控参数词组以及调控指标词组进行匹配。优选地,所述存储单元,进一步用于预先为所述调控动作词组、所述调控参数词组以及所述调控指标词组存储对应的语音播放文件;所述指令处理单元,进一步用于确定与所述各个实体词相匹配的目标调控动作词组、目标调控参数词组以及目标调控指标词组;按照预设的调控参数-调控动作-调控指标的播放顺序,顺次播放所述目标调控参数词组对应的语音播放文件、所述目标调控动作词组对应的语音播放文件以及所述目标调控指标词组对应的语音播放文件。优选地,所述指令处理单元,进一步用于根据下述匹配度计算公式,计算所述匹配度;其中,ω表征匹配度;ai表征第i个实体词与调控参数词组最大重合字数;Ai表征与第i个实体词具有最大重合字数的调控参数词组的字数;bi表征第i个实体词与调控动作词组最大重合字数;Bi表征与第i个实体词具有最大重合字数的调控动作词组的字数;ci表征第i个实体词与调控指标词组最大重合字数;Ci表征与第i个实体词具有最大重合字数的调控指标词组的字数,n表征实体词的总个数。本专利技术实施例提供了一种离线语音识别方法和装置,该离线语音识别方法可包括:控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当匹配度不小于预设的匹配阈值时,查找与当前语音信息相匹配的当前标准播放语音,并播报当前标准播放语音;将指令唤醒状态转换为确认唤醒状态;在接收到当前语音信息对应的下一条语音信息时,判断下一条语音信息是否包含有确认词,如果是,则执行当前标准播放语音对应的操作指令,即在本专利技术提供的方案中,对于用户发出的语音指令,在匹配出标准播放语音,通过语音播报的方式播报该标准播放语音,在得到用户的确认后,才执行标准播放语音对应的操作指令,能够有效地提高离线语音识别的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个实施例提供的离线语音识别方法的流程图;图2是本专利技术另一个实施例提供的离线语音识别方法的流程图本文档来自技高网...

【技术保护点】
1.一种离线语音识别方法,其特征在于,包括:控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将所述当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当所述匹配度不小于预设的匹配阈值时,查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音;将所述指令唤醒状态转换为确认唤醒状态;在接收到所述当前语音信息对应的下一条语音信息时,判断所述下一条语音信息是否包含有确认词,如果是,则执行所述当前标准播放语音对应的操作指令。

【技术特征摘要】
1.一种离线语音识别方法,其特征在于,包括:控制当前工作状态进入指令唤醒状态;在接收到当前语音信息时,将所述当前语音信息与预存储的语音标准指令进行匹配,并计算匹配度;当所述匹配度不小于预设的匹配阈值时,查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音;将所述指令唤醒状态转换为确认唤醒状态;在接收到所述当前语音信息对应的下一条语音信息时,判断所述下一条语音信息是否包含有确认词,如果是,则执行所述当前标准播放语音对应的操作指令。2.根据权利要求1所述的离线语音识别方法,其特征在于,在所述控制当前状态进入指令唤醒状态之后,在所述接收到当前语音信息之前,进一步包括:在所述指令唤醒状态持续时长达到预设的时长阈值时,清除与所述当前语音信息相关的记录信息,并转换为休眠状态;和/或,在所述控制所述指令唤醒状态转换为确认唤醒状态之后,在所述接收到所述当前语音信息对应的下一条语音信息之前,进一步包括:在所述确认唤醒状态持续时长达到预设的时长阈值时,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。3.根据权利要求1所述的离线语音识别方法,其特征在于,在所述计算匹配度之后,进一步包括:当所述匹配度小于预设的匹配阈值时,给出操作失败的语音提示,清除与所述当前语音信息相关的记录信息,并转换为休眠状态;和/或,进一步包括:当所述下一条语音信息不包含确认词时,给出操作失败的语音提示,清除与所述当前语音信息相关的记录信息,并转换为休眠状态。4.根据权利要求1所述的离线语音识别方法,其特征在于,进一步包括:在当前工作状态为休眠状态时,接收到语音唤醒词,则执行所述控制当前工作状态进入指令唤醒状态;或者,在当前工作状态为休眠状态时,接收到唤醒触发信号,则执行所述控制当前工作状态进入指令唤醒状态。5.根据权利要求1所述的离线语音识别方法,其特征在于,所述语音标准指令,包括:多个调控动作词组、多个调控参数词组以及多个调控指标词组;所述将所述当前语音信息与预存储的语音标准指令进行匹配,包括:将所述当前语音信息转换为对应的调控文本;对所述调控文本进行分词;将分词结果中的各个实体词分别与所述调控动作词组、调控参数词组以及调控指标词组进行匹配。6.根据权利要求5所述的离线语音识别方法,其特征在于,进一步包括:预先为所述调控动作词组、所述调控参数词组以及所述调控指标词组存储对应的语音播放文件;所述查找与所述当前语音信息相匹配的当前标准播放语音,并播报所述当前标准播放语音,包括:确定与所述各个实体词相匹配的目标调控动作词组、目标调控参数词组以及目标调控指标词组;按照预设的调控参数-调控动作-调控指标的播放顺序,顺次播放所述目标调控参数词组对应的语音播放文件、所述目标调控动作词组对应的语音播放文件以及所述目...

【专利技术属性】
技术研发人员:文俊刘皓叶莉
申请(专利权)人:四川虹美智能科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1