语音唤醒的数据包处理方法和装置制造方法及图纸

技术编号:21685879 阅读:36 留言:0更新日期:2019-07-24 14:36
本申请提出一种语音唤醒的数据包处理方法和装置,其中,方法包括:通过获取当前语音数据包的音频时间长度和预计处理时间;根据音频时间长度和预计处理时间生成唤醒引擎的唤醒实时率;检测唤醒实时率是否满足预设的数据包处理条件;若唤醒实时率满足预设的数据包处理条件,则将当前累加值增加唤醒实时率后作为新的当前累加值;判断新的当前累加值是否大于等于预设处理阈值;若新的当前累加值大于等于预设处理阈值,则将当前系统中的语音数据包从当前系统中进行删除。由此,通过唤醒引擎根据唤醒实时率检测的机制,主动删除语音数据包,增加了CPU的利用率,预防了唤醒卡顿现象,提升了用户体验。

Packet Processing Method and Device for Voice Wake-up

【技术实现步骤摘要】
语音唤醒的数据包处理方法和装置
本申请涉及数据处理
,尤其涉及一种语音唤醒的数据包处理方法和装置。
技术介绍
通常,在某些车载场景中,由于硬件限制,处理器的资源是及其有限的,由于语音唤醒功能长期在后台运行,所以无法避免与其他系统程序同时争夺CPU(CentralProcessingUnit,中央处理器)资源的场景,比如在车载场景中,用户正在听音乐,并且打开地图导航到某个目的地,同时用户希望使用语音交互的功能,如果在硬件处理器有限的平台上运行耗费CPU资源的其他功能时,唤醒引擎无法申请到处理器资源,于是只能等待处理器资源空闲后分配,用户在说出唤醒词后,由于引擎并没有开始处理,所以系统不会对用户进行反馈,此时用户往往会以为上次唤醒失败,会尝试再次或多次说出唤醒词,当等到CPU资源空闲时,唤醒引擎才会开始处理积累的语音数据,此时由于之前的数据积累会产生多个语音唤醒结果,所以语音交互系统会在CPU空闲后给出多次反馈,产生了语音唤醒卡顿的问题。申请内容本申请旨在至少在一定程度上解决上述相关技术中的技术问题之一。为此,本申请的第一个目的在于提出一种语音唤醒的数据包处理方法,解决了现有技术中语音唤醒的数据包处理的方式会引起唤醒卡顿的的技术问题,通过唤醒引擎根据唤醒实时率检测的机制,主动删除语音数据包,增加了CPU的利用率,预防了唤醒卡顿现象,提升了用户体验。本申请的第二个目的在于提出一种语音唤醒的数据包处理装置。本申请的第三个目的在于提出一种计算机设备。本申请的第四个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本申请第一方面实施例提出了一种语音唤醒的数据包处理方法,包括:获取当前语音数据包的音频时间长度和预计处理时间;根据所述音频时间长度和所述预计处理时间生成唤醒引擎的唤醒实时率;检测所述唤醒实时率是否满足预设的数据包处理条件;若所述唤醒实时率满足预设的数据包处理条件,则将当前累加值增加所述唤醒实时率后作为新的当前累加值;判断所述新的当前累加值是否大于等于预设处理阈值;若所述新的当前累加值大于等于所述预设处理阈值,则将当前系统中的语音数据包从当前系统中进行删除。另外,本申请实施例的语音唤醒的数据包处理方法,还具有如下附加的技术特征:可选地,所述检测所述唤醒实时率是否满足预设的数据包处理条件,包括:设置预设阈值;判断所述唤醒实时率是否大于所述预设阈值。可选地,在所述检测所述唤醒实时率是否满足预设的数据包处理条件之后,还包括:若所述唤醒实时率不满足预设的数据包处理条件,则对接收到的语音数据包进行识别处理,并将当前累加值清零。可选地,所述根据所述音频时间长度和所述预计处理时间生成唤醒引擎的唤醒实时率,包括:计算所述预计处理时间与所述音频时间长度的比值;根据所述预计处理时间与所述音频时间长度的比值生成所述唤醒实时率。可选地,所述将当前系统中的语音数据包从当前系统中进行删除,包括:将所述当前系统中的全部语音数据包从当前系统中进行删除;或将全部语音数据包进行接收时间进行排序,将排序前的N个语音数据包进行删除。为达上述目的,本申请第二方面实施例提出了一种语音唤醒的数据包处理装置,包括:获取模块,用于获取当前语音数据包的音频时间长度和预计处理时间;生成模块,用于根据所述音频时间长度和所述预计处理时间生成唤醒引擎的唤醒实时率;检测模块,用于检测所述唤醒实时率是否满足预设的数据包处理条件;统计模块,用于若所述唤醒实时率满足预设的数据包处理条件,则将当前累加值增加所述唤醒实时率后作为新的当前累加值;判断模块,用于判断所述新的当前累加值是否大于等于预设处理阈值;处理模块,用于若所述新的当前累加值大于等于预设处理阈值,则将当前系统中的语音数据包从当前系统中进行删除。另外,本申请实施例的语音唤醒的数据包处理装置,还具有如下附加的技术特征:可选地,所述检测模块,具体用于:设置预设阈值;判断所述唤醒实时率是否大于所述预设阈值。可选地,所述的装置,还包括:识别模块,用于若所述唤醒实时率不满足预设的数据包处理条件,则对接收到的语音数据包进行识别处理,并将当前累加值清零。可选地,所述生成模块,具体用于:计算所述预计处理时间与所述音频时间长度的比值;根据所述预计处理时间与所述音频时间长度的比值生成所述唤醒实时率。可选地,所述处理模块,具体用于:将所述当前系统中的全部语音数据包从当前系统中进行删除;或将全部语音数据包进行接收时间进行排序,将排序前的N个语音数据包进行删除。为达上述目的,本申请第三方面实施例提出了一种计算机设备,包括:处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的语音唤醒的数据包处理方法。为达上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的语音唤醒的数据包处理方法。为达上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,实现如第一方面实施例所述的语音唤醒的数据包处理方法。本申请实施例提供的技术方案可以包含如下的有益效果:通过获取当前语音数据包的音频时间长度和预计处理时间,并根据音频时间长度和预计处理时间生成唤醒引擎的唤醒实时率,以及检测唤醒实时率是否满足预设的数据包处理条件,在唤醒实时率满足预设的数据包处理条件时将当前累加值增加唤醒实时率后作为新的当前累加值,并判断新的当前累加值是否大于等于预设处理阈值,在新的当前累加值大于等于预设处理阈值时将当前系统中的语音数据包从当前系统中进行删除。由此,通过唤醒引擎根据唤醒实时率检测的机制,主动删除语音数据包,增加了CPU的利用率,预防了唤醒卡顿现象,提升了用户体验。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是根据本申请现有技术中的语音唤醒的数据包处理方法的流程图;图2是根据本申请一个实施例的语音唤醒的数据包处理方法的流程图;图3是根据本申请一个具体实施例的语音唤醒的数据包处理的示例图;图4是根据本申请一个实施例的语音唤醒的数据包处理装置的结构示意图;图5是根据本申请另一个实施例的语音唤醒的数据包处理装置的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的语音唤醒的数据包处理方法和装置。针对
技术介绍
中提到的,现有技术中在多个耗费CPU的应用程序使用CPU资源时,在同一个平台上处理器资源的总占用可能高达90%,唤醒引擎对语音数据包的处理需要CPU分配10%以上的资源,此时只能等待CPU空闲后再分配资源进行计算,往往用户在第一次唤醒失败时,会尝试再次唤醒,所以在CPU空闲后会出现了唤醒结果响应多次的技术问题。如图1所示,用户说出“小度小度”,此时系统处于高负本文档来自技高网
...

【技术保护点】
1.一种语音唤醒的数据包处理方法,其特征在于,包括以下步骤:获取当前语音数据包的音频时间长度和预计处理时间;根据所述音频时间长度和所述预计处理时间生成唤醒引擎的唤醒实时率;检测所述唤醒实时率是否满足预设的数据包处理条件;若所述唤醒实时率满足预设的数据包处理条件,则将当前累加值增加所述唤醒实时率后作为新的当前累加值;判断所述新的当前累加值是否大于等于预设处理阈值;若所述新的当前累加值大于等于所述预设处理阈值,则将当前系统中的语音数据包从当前系统中进行删除。

【技术特征摘要】
1.一种语音唤醒的数据包处理方法,其特征在于,包括以下步骤:获取当前语音数据包的音频时间长度和预计处理时间;根据所述音频时间长度和所述预计处理时间生成唤醒引擎的唤醒实时率;检测所述唤醒实时率是否满足预设的数据包处理条件;若所述唤醒实时率满足预设的数据包处理条件,则将当前累加值增加所述唤醒实时率后作为新的当前累加值;判断所述新的当前累加值是否大于等于预设处理阈值;若所述新的当前累加值大于等于所述预设处理阈值,则将当前系统中的语音数据包从当前系统中进行删除。2.如权利要求1所述的方法,其特征在于,所述检测所述唤醒实时率是否满足预设的数据包处理条件,包括:设置预设阈值;判断所述唤醒实时率是否大于所述预设阈值。3.如权利要求1所述的方法,其特征在于,在所述检测所述唤醒实时率是否满足预设的数据包处理条件之后,还包括:若所述唤醒实时率不满足预设的数据包处理条件,则对接收到的语音数据包进行识别处理,并将当前累加值清零。4.如权利要求1所述的方法,其特征在于,所述根据所述音频时间长度和所述预计处理时间生成唤醒引擎的唤醒实时率,包括:计算所述预计处理时间与所述音频时间长度的比值;根据所述预计处理时间与所述音频时间长度的比值生成所述唤醒实时率。5.如权利要求1所述的方法,其特征在于,所述将当前系统中的语音数据包从当前系统中进行删除,包括:将所述当前系统中的全部语音数据包从当前系统中进行删除;或将全部语音数据包进行接收时间进行排序,将排序前的N个语音数据包进行删除。6.一种语音唤醒的数据包处理装置,其特征在于,包括:获取模块,用于获取当前语音数据包的音频时间长度和预计处理时间;生成模块,用于根据...

【专利技术属性】
技术研发人员:贺学焱陈建哲王兴
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1