一种人工智能的重置方法及装置、存储介质制造方法及图纸

技术编号:22365472 阅读:44 留言:0更新日期:2019-10-23 05:08
本发明专利技术实施例提供了一种人工智能的重置方法及装置、存储介质,该方法包括:获取待检测音频数据;将待检测音频数据进行音频特征提取,将音频特征输入至语音检测模型中,输出了当前检测结果;将当前检测结果与预设重置门限进行对比,当当前检测结果满足预设重置门限时,表征进行语音检测模型的重置,获取当前时间点,确定当前时间点为重置时间点其中,预设重置门限大于等于预设唤醒门限;在重置时间点到达时,重置语音检测模型。

A reset method, device and storage medium of artificial intelligence

【技术实现步骤摘要】
一种人工智能的重置方法及装置、存储介质分案说明本申请基于申请号为201811361659.4、申请日为2018年11月15日、专利技术名称为一种音频数据处理方法及装置、存储介质的中国专利申请提出,在该中国专利申请记载的范围内提出分案,该中国专利申请的全部内容在此引入本申请作为参考。
本专利技术涉及人工智能领域中的语音识别技术,尤其涉及一种人工智能的数据检测方法及装置、存储介质。
技术介绍
随着人工智能(AI,ArtificialIntelligence)在各个领域中的应用越来越多,成为了各个领域进行决策和预测的一种重要手段。例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。目前,电子领域的语音交互智能设备主要是智能音箱,例如,带语音控制功能的智能电视或电视盒子等产品。这些语音交互智能设备等类似产品中一般都会设置一个或多个唤醒词。然而,由于LSTM的一个重要特征是历史信息积累特性,即采用LSTM进行语音识别时,对一段语音数据(例如,唤醒词的语音数据)的检测结果不仅与这段语音数据的本身相关,也受到这段语音数据之前的音频数据的巨大影响。因此,在唤醒词的检测中,唤醒时机很重要,在一段时间的噪声积累之后,噪声数据的积累对之后的唤醒词的唤醒受到唤醒时机不准确的影响,从而导致了唤醒词的语音识别的准确率下降。
技术实现思路
本专利技术实施例提供一种人工智能的重置方法及装置、存储介质,通过获取重置时间点,以便通过重置时间点进行唤醒时机的重置,从而提高语音识别的准确率。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种人工智能的重置方法,包括:获取待检测音频数据;将所述待检测音频数据进行音频特征提取,将所述音频特征输入至语音检测模型中,输出了当前检测结果;将所述当前检测结果与预设重置门限进行对比,当所述当前检测结果满足预设重置门限时,表征进行语音检测模型的重置,获取当前时间点,确定所述当前时间点为重置时间点其中,预设重置门限大于等于预设唤醒门限;在所述重置时间点到达时,重置所述语音检测模型。在上述方案中,所述至少一个检测通路包括:备份检测通路;所述获取待检测音频数据之后,上述将所述当前检测结果与预设重置门限进行对比之前,所述方法还包括:当检测到的至少一个检测通路的数量为多个时,获取当前时间点;当所述当前时间点达到预设预热时间点时,将所述当前时间点确定为所述备份检测通路的重置时间点,其中,所述预设预热时间点为从预设重置时间点开始之前的预设预热时间段的时间点。在上述方案中,所述将所述待检测音频数据进行音频特征提取,将所述音频特征输入至语音检测模型中,输出了当前检测结果之后,所述方法还包括:获取当前时间点之前的历史检测结果;当所述当前检测结果和所述历史检测结果之间的变化范围满足预设误唤醒范围时,确定所述当前时间点为所述重置时间点。在上述方案中,所述在所述重置时间点到达时,重置所述语音检测模型,包括:当所述当前时间点达到预设预热时间点时,重置并启动所述备份检测通路。在上述方案中,所述至少一个检测通路还包括:主检测通路;所述重置并启动所述备份检测通路之后,所述方法还包括:采用所述主检测通路和所述备份检测通路进行语音识别;当经过所述预设预热时间段之后,到达所述预设重置时间点时,重置所述主检测通路;当从所述预设重置时间点开始再经过所述预设预热时间段时,关闭所述备份检测通路,采用所述主检测通路进行语音识别。在上述方案中,所述预设重置时间点为间隔预设时间长度的时间序列;所述预设时间长度在2倍的预设预热时间段和预设容忍唤醒阈值的范围内;所述预设容忍唤醒阈值在预设最佳唤醒上限值和预设最佳误唤醒下限值之间;所述预设预热时间段大于等于预设唤醒词持续时间。在上述方案中,所述采用所述主检测通路和所述备份检测通路进行语音识别,包括:接收待检测音频数据;采用所述主检测通路和所述备份检测通路分别对所述待检测音频数据进行语音识别,得到主检测结果和备份检测结果;对所述主检测结果和所述备份检测结果进行综合处理,得到总检测结果;当所述总检测结果大于预设唤醒门限时,识别出所述待检测音频数据为唤醒词,启动唤醒功能。在上述方案中,所述采用所述主检测通路进行语音识别,包括:接收待检测音频数据;采用所述主检测通路对所述待检测音频数据进行语音识别,得到主检测结果;当所述主检测结果大于预设唤醒门限时,识别出所述待检测音频数据为唤醒词,启动唤醒功能。在上述方案中,所述在所述重置时间点到达时,重置所述语音检测模型,包括:在所述重置时间点到达时,初始化所述语音检测模型中的具有历史积累特性的数据,得到重置后的语音检测模型。本专利技术实施例提供一种音人工智能的重置装置,包括:获取单元,用于获取待检测音频数据;识别单元,用于将所述待检测音频数据进行音频特征提取,将所述音频特征输入至语音检测模型中,输出了当前检测结果;确定单元,用于将所述当前检测结果与预设重置门限进行对比,当所述当前检测结果满足预设重置门限时,表征进行语音检测模型的重置,获取当前时间点,确定所述当前时间点为重置时间点其中,预设重置门限大于等于预设唤醒门限;重置单元,用于在所述重置时间点到达时,重置所述语音检测模型。在上述装置中,所述至少一个检测通路包括:备份检测通路;所述获取单元,还用于所述获取待检测音频数据之后,上述将所述当前检测结果与预设重置门限进行对比之前,当检测到的至少一个检测通路的数量为多个时,获取当前时间点;所述确定单元,还用于当所述当前时间点达到预设预热时间点时,将所述当前时间点确定为所述备份检测通路的重置时间点,其中,所述预设预热时间点为从预设重置时间点开始之前的预设预热时间段的时间点。在上述装置中,所述获取单元,还用于将所述待检测音频数据进行音频特征提取,将所述音频特征输入至语音检测模型中,输出了当前检测结果之后,获取当前时间点之前的历史检测结果;所述确定单元,还用于当所述当前检测结果和所述历史检测结果之间的变化范围满足预设误唤醒范围时,确定所述当前时间点为所述重置时间点。本专利技术实施例提供一种人工智能的重置装置,包括:存储器,用于存储可执行重置指令;处理器,用于执行所述存储器中存储的可执行重置令时,实现本专利技术实施例提供的人工智能的重置方法。本专利技术实施例提供一种计算机可读存储介质,存储有可执行重置指令,用于引起处理器执行时,实现本专利技术实施例提供的人工智能的重置方法。本专利技术实施例具有以下有益效果:本专利技术实施例提供了一种人工智能的重置方法及装置、存储介质,通过获取待检测音频数据;将待检测音频数据进行音频特征提取,将音频特征输入至语音检测模型中,输出了当前检测结果;将当前检测结果与预设重置门限进行对比,当当前检测结果满足预设重置门限时,表征进行语音检测模型的重置,获取当前时间点,确定当前时间点为重置时间点其中,预设重置门限大于等于预设唤醒门限;在重置时间点到达时,重置语音检测模型。采用上述技术实现方案,如果用户需要在短时间内进行多次唤醒操作,当人工智能的重置装置对该用户的唤醒词(待检测音频数据)进行语音检测模型输出的得分(当前检测结果)成功超过预设重置门限一次以后,本文档来自技高网...

【技术保护点】
1.一种人工智能的重置方法,其特征在于,包括:获取待检测音频数据;将所述待检测音频数据进行音频特征提取,将所述音频特征输入至语音检测模型中,输出了当前检测结果;将所述当前检测结果与预设重置门限进行对比,当所述当前检测结果满足预设重置门限时,表征进行语音检测模型的重置,获取当前时间点,确定所述当前时间点为重置时间点其中,预设重置门限大于等于预设唤醒门限;在所述重置时间点到达时,重置所述语音检测模型。

【技术特征摘要】
1.一种人工智能的重置方法,其特征在于,包括:获取待检测音频数据;将所述待检测音频数据进行音频特征提取,将所述音频特征输入至语音检测模型中,输出了当前检测结果;将所述当前检测结果与预设重置门限进行对比,当所述当前检测结果满足预设重置门限时,表征进行语音检测模型的重置,获取当前时间点,确定所述当前时间点为重置时间点其中,预设重置门限大于等于预设唤醒门限;在所述重置时间点到达时,重置所述语音检测模型。2.根据权利要求1所述的方法,其特征在于,所述至少一个检测通路包括:备份检测通路;所述获取待检测音频数据之后,上述将所述当前检测结果与预设重置门限进行对比之前,所述方法还包括:当检测到的至少一个检测通路的数量为多个时,获取当前时间点;当所述当前时间点达到预设预热时间点时,将所述当前时间点确定为所述备份检测通路的重置时间点,其中,所述预设预热时间点为从预设重置时间点开始之前的预设预热时间段的时间点。3.根据权利要求1所述的方法,其特征在于,所述将所述待检测音频数据进行音频特征提取,将所述音频特征输入至语音检测模型中,输出了当前检测结果之后,所述方法还包括:获取当前时间点之前的历史检测结果;当所述当前检测结果和所述历史检测结果之间的变化范围满足预设误唤醒范围时,确定所述当前时间点为所述重置时间点。4.根据权利要求1至3任一项所述的方法,其特征在于,所述在所述重置时间点到达时,重置所述语音检测模型,包括:当所述当前时间点达到预设预热时间点时,重置并启动所述备份检测通路。5.根据权利要求4所述的方法,其特征在于,所述至少一个检测通路还包括:主检测通路;所述重置并启动所述备份检测通路之后,所述方法还包括:采用所述主检测通路和所述备份检测通路进行语音识别;当经过所述预设预热时间段之后,到达所述预设重置时间点时,重置所述主检测通路;当从所述预设重置时间点开始再经过所述预设预热时间段时,关闭所述备份检测通路,采用所述主检测通路进行语音识别。6.根据权利要求2、4或5任一项所述的方法,其特征在于,所述预设重置时间点为间隔预设时间长度的时间序列;所述预设时间长度在2倍的预设预热时间段和预设容忍唤醒阈值的范围内;所述预设容忍唤醒阈值在预设最佳唤醒上限值和预设最佳误唤醒下限值之间;所述预设预热时间段大于等于预设唤醒词持续时间。7.根据权利要求5所述的方法,其特征在于,所述采用所述主检测通路和所述备份检测通路进行语音识别,包括:接收待检测音频数据;采用所述主检测通路和所述备份检测通路分别对所述待检测音频数据进行语音识别,得到...

【专利技术属性】
技术研发人员:郑脊萌高毅黎韦伟于蒙
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1