一种人工智能的数据检测方法及装置、存储介质制造方法及图纸

技术编号:22469280 阅读:23 留言:0更新日期:2019-11-06 12:20
本发明专利技术实施例提供了一种人工智能的数据检测方法及装置、存储介质,该方法包括:获取待检测音频数据;当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型;利用重置后语音检测模型对主检测通路和备份检测通路的待检测音频数据进行识别,得到主检测通路的主检测结果和备份检测通路备份检测结果;将主检测结果和备份检测结果进行综合处理后,输出总检测结果。

A data detection method, device and storage medium of artificial intelligence

【技术实现步骤摘要】
一种人工智能的数据检测方法及装置、存储介质分案说明本申请基于申请号为201811361659.4、申请日为2018年11月15日、专利技术名称为一种音频数据处理方法及装置、存储介质的中国专利申请提出,在该中国专利申请记载的范围内提出分案,该中国专利申请的全部内容在此引入本申请作为参考。
本专利技术涉及人工智能领域中的语音识别技术,尤其涉及一种人工智能的数据检测方法及装置、存储介质。
技术介绍
随着人工智能(AI,ArtificialIntelligence)在各个领域中的应用越来越多,成为了各个领域进行决策和预测的一种重要手段。例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。目前,电子领域的语音交互智能设备主要是智能音箱,例如,带语音控制功能的智能电视或电视盒子等产品。这些语音交互智能设备等类似产品中一般都会设置一个或多个唤醒词。一般采用长短期记忆单元模型(LSTM,LongShortTermMemory)作为的唤醒检测模型来进行唤醒词的检测。然而,由于LSTM的一个重要特征是历史信息积累特性,即采用LSTM进行语音识别时,对一段语音数据(例如,唤醒词的语音数据)的检测结果不仅与这段语音数据的本身相关,也受到这段语音数据之前的音频数据的巨大影响。因此,在唤醒词的数据检测一段时间的噪声积累之后,噪声数据的积累对之后的唤醒词的检测性能产生影响,从而导致了数据检测的准确率下降。
技术实现思路
本专利技术实施例提供一种人工智能的数据检测方法及装置、存储介质,能够提高数据检测的准确率。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种人工智能的数据检测方法,包括:获取待检测音频数据;当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型;利用所述重置后语音检测模型对主检测通路和备份检测通路的所述待检测音频数据进行识别,得到所述主检测通路的主检测结果和所述备份检测通路备份检测结果;将所述主检测结果和所述备份检测结果进行综合处理后,输出总检测结果。在上述方案中,所述当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型,包括:获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;当检测到的检测通路备份包含主检测通路和备份检测通路时,获取当前时间点;当所述当前时间点达到预设预热时间点时,将所述当前时间点确定为所述备份检测通路的重置时间点,其中,所述预设预热时间点为从预设重置时间点开始之前的预设预热时间段的时间点;在所述重置时间点到达时,通过重置和启动控制器控制备份检测通路的重置和启动,重置所述备份检测通路,得到备份检测通路的重置后语音检测模型;采用所述主检测通路和所述备份检测通路进行语音识别;当经过所述预设预热时间段之后,到达所述预设重置时间点时,通过重置和启动控制器控制主检测通路的重置,重置所述主检测通路,得到主检测通路的重置后语音检测模型。在上述方案中,所述当经过所述预设预热时间段之后,到达所述预设重置时间点时,通过重置和启动控制器控制主检测通路的重置,重置所述主检测通路,得到主检测通路的重置后语音检测模型之后,所述方法还包括:当从所述预设重置时间点开始再经过所述预设预热时间段时,关闭所述备份检测通路,采用所述主检测通路进行语音识别。在上述方案中,所述利用所述重置后语音检测模型对主检测通路和备份检测通路的所述待检测音频数据进行识别,得到所述主检测通路的主检测结果和所述备份检测通路备份检测结果之后,所述方法还包括:获取当前时间点之前的历史检测结果;当所述当前检测结果和所述历史检测结果之间的变化范围满足预设误唤醒范围时,确定所述当前时间点为所述重置时间点。在上述方案中,所述利用所述重置后语音检测模型对主检测通路和备份检测通路的所述待检测音频数据进行识别,得到所述主检测通路的主检测结果和所述备份检测通路备份检测结果之后,所述方法还包括:获取当前时间点之前的历史检测结果;当所述当前检测结果和所述历史检测结果之间的变化范围满足预设误唤醒范围时,确定所述当前时间点为所述重置时间点。在上述方案中,所述采用所述主检测通路和所述备份检测通路进行语音识别,包括:接收待检测音频数据;采用所述主检测通路和所述备份检测通路分别对所述待检测音频数据进行语音识别,得到主检测结果和备份检测结果;对所述主检测结果和所述备份检测结果进行综合处理,得到总检测结果;当所述总检测结果大于预设唤醒门限时,识别出所述待检测音频数据为唤醒词,启动唤醒功能。在上述方案中,所述采用所述主检测通路进行语音识别,包括:接收待检测音频数据;采用所述主检测通路对所述待检测音频数据进行语音识别,得到主检测结果;当所述主检测结果大于预设唤醒门限时,识别出所述待检测音频数据为唤醒词,启动唤醒功能。本专利技术实施例提供一种音人工智能的数据检测装置,包括:获取单元,用于获取待检测音频数据;重置单元,用于当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型;识别单元,用于利用所述重置后语音检测模型对主检测通路和备份检测通路的所述待检测音频数据进行识别,得到所述主检测通路的主检测结果和所述备份检测通路备份检测结果;将所述主检测结果和所述备份检测结果进行综合处理后,输出总检测结果。在上述装置中,所述获取单元,还用于获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;当检测到的检测通路备份包含主检测通路和备份检测通路时,获取当前时间点;确定单元,用于当所述当前时间点达到预设预热时间点时,将所述当前时间点确定为所述备份检测通路的重置时间点,其中,所述预设预热时间点为从预设重置时间点开始之前的预设预热时间段的时间点;所述重置单元,还用于在所述重置时间点到达时,通过重置和启动控制器控制备份检测通路的重置和启动,重置所述备份检测通路,得到备份检测通路的重置后语音检测模型;所述识别单元,还用于采用所述主检测通路和所述备份检测通路进行语音识别;所述重置单元,还用于当经过所述预设预热时间段之后,到达所述预设重置时间点时,通过重置和启动控制器控制主检测通路的重置,重置所述主检测通路,得到主检测通路的重置后语音检测模型。在上述装置中,所述识别单元,还用于所述当经过所述预设预热时间段之后,到达所述预设重置时间点时,通过重置和启动控制器控制主检测通路的重置,重置所述主检测通路,得到主检测通路的重置后语音检测模型之后,当从所述预设重置时间点开始再经过所述预设预热时间段时,关闭所述备份检测通路,采用所述主检测通路进行语音识别。在上述装置中,所述获取单元,还用于利用所述重置后语音检测模型对主检测通路和备份检测通路的所述待检测音频数据进行识别,得到所本文档来自技高网...

【技术保护点】
1.一种人工智能的数据检测方法,其特征在于,包括:获取待检测音频数据;当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型;利用所述重置后语音检测模型对主检测通路和备份检测通路的所述待检测音频数据进行识别,得到所述主检测通路的主检测结果和所述备份检测通路备份检测结果;将所述主检测结果和所述备份检测结果进行综合处理后,输出总检测结果。

【技术特征摘要】
1.一种人工智能的数据检测方法,其特征在于,包括:获取待检测音频数据;当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型;利用所述重置后语音检测模型对主检测通路和备份检测通路的所述待检测音频数据进行识别,得到所述主检测通路的主检测结果和所述备份检测通路备份检测结果;将所述主检测结果和所述备份检测结果进行综合处理后,输出总检测结果。2.根据权利要求1所述的方法,其特征在于,所述当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型,包括:获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;当检测到的检测通路备份包含主检测通路和备份检测通路时,获取当前时间点;当所述当前时间点达到预设预热时间点时,将所述当前时间点确定为所述备份检测通路的重置时间点,其中,所述预设预热时间点为从预设重置时间点开始之前的预设预热时间段的时间点;在所述重置时间点到达时,通过重置和启动控制器控制备份检测通路的重置和启动,重置所述备份检测通路,得到备份检测通路的重置后语音检测模型;采用所述主检测通路和所述备份检测通路进行语音识别;当经过所述预设预热时间段之后,到达所述预设重置时间点时,通过重置和启动控制器控制主检测通路的重置,重置所述主检测通路,得到主检测通路的重置后语音检测模型。3.根据权利要求2所述的方法,其特征在于,所述当经过所述预设预热时间段之后,到达所述预设重置时间点时,通过重置和启动控制器控制主检测通路的重置,重置所述主检测通路,得到主检测通路的重置后语音检测模型之后,所述方法还包括:当从所述预设重置时间点开始再经过所述预设预热时间段时,关闭所述备份检测通路,采用所述主检测通路进行语音识别。4.根据权利要求1所述的方法,其特征在于,所述利用所述重置后语音检测模型对主检测通路和备份检测通路的所述待检测音频数据进行识别,得到所述主检测通路的主检测结果和所述备份检测通路备份检测结果之后,所述方法还包括:获取当前时间点之前的历史检测结果;当所述当前检测结果和所述历史检测结果之间的变化范围满足预设误唤醒范围时,确定所述当前时间点为所述重置时间点。5.根据权利要求2所述的方法,其特征在于,所述基于所述综合检测结果,实现唤醒功能,包括:所述预设重置时间点为间隔预设时间长度的时间序列;所述预设时间长度在2倍的预设预热时间段和预设容忍唤醒阈值的范围内;所述预设容忍唤醒阈值在预设最佳唤醒上限值和预设最佳误唤醒下限值之间;所述预设预热时间段大于等于预设唤醒词持续时间。6.根据权利要求2所述的方法,其特征在于,所述采用所述主检测通路和所述备份检测通路进行语音识别,包括:接收待检测音频数据;采用所述主检测通路和所述备份检测通路分别对所述待检测音频数据进行语音识别,得到主检测结果和备份检测结果;对所述主检测结果和所述备份检测结果进行综合处理,得到总检测结果;当所述总检测结果大于预设唤醒门限时,识别出所述待检测音频数据为唤醒词,启动唤醒功能。7.根据权利要求3所述的方法,其特征在于,所述采用所述主检测通路进行语音识别,包括:接收待检测音频数据;采用所述主检测通路对所述待检测音频数据进行语音识别,得到主检测结果;当所述主检测结果大于预设唤醒门限时,识别出所述待检测音频数据为唤醒词,启动唤醒功能。8.一种数据检测装置,其特征在于,包括:获取单元,用于获取待检测音频数据;重置单元...

【专利技术属性】
技术研发人员:郑脊萌高毅黎韦伟于蒙
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1