一种基于高斯混合概率密度的数据处理方法、装置、设备及介质制造方法及图纸

技术编号:35459713 阅读:17 留言:0更新日期:2022-11-03 12:25
本申请公开了一种基于高斯混合概率密度的数据处理方法及系统,涉及音频数据处理技术领域。该方法包括:将获取的音频数据按照端点检测时间窗长度进行划分,得到端点检测帧序列,端点检测时间窗用于判断音频数据是否有端点,并统计端点检测次数;根据端点检测帧序列确定端点检测时间窗的信度,信度为表征音频数据是否有端点的信度;当信度大于预设信度时,输出端点检测时间节点和端点检测次数。由于对音频数据只进行了一次划分,全部的音频数据均用于得出表征音频数据在音频过程中的信度。此时降低了输出的端点检测次数和端点检测时间节点的偏差,得出精确的端点检测,提升音频数据语句翻译唱词的连续性。据语句翻译唱词的连续性。据语句翻译唱词的连续性。

【技术实现步骤摘要】
一种基于高斯混合概率密度的数据处理方法、装置、设备及介质


[0001]本申请涉及音频数据处理
,特别是涉及一种基于高斯混合概率密度的数据处理方法、装置、设备及介质。

技术介绍

[0002]音频端点检测技术时语音技术研究的一个新的领域,其应用于自动音频翻译以及自动字幕生成系统中。现有技术中,是将音频数据先转换为文字,当音频数据播放出来后,再根据音频数据放上相应的文字,这就需要编辑人员将一句一句编辑放上去,而且很有可能就是声音和文字对不上,而且断句不规整,影响唱词文件生成的质量和效率。
[0003]但是现有的音频端点检测技术比较受限于背景噪声的影响,基于传统的门限技术,会将比较容易混杂的背景噪声也视为要翻译及唱词的对象,因此会从单个字(词)的语音端点检测,但是连续性不强。
[0004]因此,针对上述问题,提出一种基于高斯混合概率密度的音频数据端点检测技术。

技术实现思路

[0005]本申请的目的是提供一种基于高斯混合概率密度的数据处理方法、装置、设备及介质,用于降低输出的端点检测次数和端点检测时间节点的偏差,得出精确的端点检测,提升音频数据语句翻译唱词的连续性。
[0006]为解决上述技术问题,本申请提供一种基于高斯混合概率密度的数据处理方法,包括:
[0007]获取音频数据;
[0008]将音频数据按照端点检测时间窗长度进行划分,得到端点检测帧序列,端点检测时间窗用于判断所述音频数据是否有端点,并统计端点检测次数,所述端点包括语音起点和终点;
[0009]获取端点检测帧序列中各端点检测帧的短时能量、短时过零率以及短时信息熵;
[0010]根据短时能量、短时过零率以及短时信息熵确定端点检测时间窗的信度,信度为表征音频数据是否端点检测的信度;
[0011]判断信度是否大于预设信度;
[0012]若是,则输出端点检测时间节点和端点检测次数。
[0013]优选地,将音频数据按照端点检测时间窗长度进行划分,得到端点检测帧序列包括:
[0014]获取音频数据长度;
[0015]将音频数据长度除以端点检测时间窗长度,得到划分值;
[0016]将划分值取整,根据取整后的划分值划分音频数据,得到端点检测帧序列。
[0017]优选地,根据端点检测帧序列确定端点检测时间窗的信度包括:
[0018]对端点检测帧序列中的各端点检测列初始化;
[0019]根据初始化后的所述端点检测列获取所述短时能量、所述短时过零率以及所述短时信息熵并更新各所述端点检测列;
[0020]根据更新后的各端点检测列确定信度。
[0021]优选地,当信度大于预设信度时,在输出端点检测时间节点和端点检测次数之前,还包括:
[0022]判断端点检测帧序列中的端点检测变量的个数是否为1;
[0023]若是,则进入输出端点检测时间节点和端点检测次数的步骤;
[0024]若否,则融合多个端点检测变量对应的端点检测时间节点。
[0025]优选地,在输出端点检测时间节点和端点检测次数之后,还包括:
[0026]判断划分值个端点检测时间窗是否全部输出端点检测时间节点和端点检测次数;
[0027]若是,则结束;
[0028]若否,则返回至获取音频数据的步骤。
[0029]优选地,端点检测时间窗为多个且互不重叠。
[0030]优选地,在获取音频数据之后,在将音频数据按照端点检测时间窗长度进行划分,得到端点检测帧序列之前,还包括:
[0031]对音频数据进行卡尔曼滤波处理。
[0032]为解决上述技术问题,本申请还提供了一种基于高斯混合概率密度的数据处理装置,包括:
[0033]第一获取模块,用于获取音频数据;
[0034]划分模块,用于将音频数据按照端点检测时间窗长度进行划分,得到端点检测帧序列,端点检测时间窗用于判断所述音频数据是否有端点,并统计端点检测次数;
[0035]第二获取模块,用于获取端点检测帧序列中各端点检测列的短时能量、短时过零率以及短时信息熵;
[0036]确定模块,用于根据短时能量、短时过零率以及短时信息熵确定端点检测时间窗的信度,信度为表征音频数据是否有端点的信度;
[0037]判断模块,用于判断信度是否大于预设信度;
[0038]若是,则进入输出模块,用于输出端点检测时间节点和端点检测次数。
[0039]为解决上述技术问题,本申请还提供了一种基于高斯混合概率密度的数据处理设备,包括:
[0040]存储器,用于存储计算机程序;
[0041]处理器,用于指向计算机程序,实现基于高斯混合概率密度的数据处理方法的步骤。
[0042]为解决上述技术问题,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现上述全部基于高斯混合概率密度的数据处理方法的步骤。
[0043]本申请所提供的一种基于高斯混合概率密度的数据处理方法,包括:获取音频数据;将音频数据按照端点检测时间窗长度进行划分,得到端点检测帧序列,端点检测时间窗用于判断音频数据是否端点检测,并统计端点检测次数;获取端点检测帧序列中各端点检
测列的短时能量、短时过零率以及短时信息熵;根据短时能量、短时过零率以及短时信息熵确定端点检测时间窗的信度,信度为表征音频数据是否端点检测的信度;判断信度是否大于预设信度;若是,则输出端点检测时间节点和端点检测次数。由于对音频数据只进行了一次划分,全部的音频数据均用于得出表征音频数据在音频过程中的信度。此时降低了输出的端点检测次数和端点检测时间节点的偏差,得出精确的端点检测,提升音频数据语句翻译唱词的连续性。
[0044]本申请还提供了一种基于高斯混合概率密度的数据处理装置、设备以及介质,效果同上。
附图说明
[0045]为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0046]图1为本申请实施例所提供的一种基于高斯混合概率密度的数据处理方法的流程图;
[0047]图2为本申请实施例所提供的一种基于高斯混合概率密度的数据处理装置结构图;
[0048]图3为本申请实施例所提供的一种基于高斯混合概率密度的数据处理设备结构图。
具体实施方式
[0049]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
[0050]本申请的核心是提供一种基于高斯混合概率密度的数据处理方法、装置、设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于高斯混合概率密度的数据处理方法,其特征在于,包括:获取音频数据;将所述音频数据按照端点检测时间窗长度进行划分,得到端点检测帧序列,所述端点检测时间窗用于判断所述音频数据是否有端点,并统计端点检测次数,所述端点包括语音起点和终点;获取所述端点检测帧序列中各所述端点检测帧的短时能量、短时过零率以及短时信息熵;根据所述短时能量、所述短时过零率以及所述短时信息熵确定所述端点检测时间窗的信度,所述信度为表征所述音频数据是否有端点的信度;判断所述信度是否大于预设信度;若是,则输出所述端点检测时间节点和所述端点检测次数。2.根据权利要求1所述的基于高斯混合概率密度的数据处理方法,其特征在于,所述将所述音频数据按照端点检测时间窗长度进行划分,得到端点检测帧序列包括:获取所述音频数据长度;将所述音频数据长度除以所述端点检测时间窗长度,得到划分值;将所述划分值向上取整,根据取整后的所述划分值划分所述音频数据,得到所述端点检测帧序列。3.根据权利要求1所述的基于高斯混合概率密度的数据处理方法,其特征在于,所述根据所述短时能量、所述短时过零率以及所述短时信息熵确定所述端点检测时间窗的信度包括:对所述端点检测帧序列中的各端点检测列初始化;根据初始化后的所述端点检测列获取所述短时能量、所述短时过零率以及所述短时信息熵并更新各所述端点检测帧;根据更新后的各所述端点检测帧确定所述信度。4.根据权利要求3所述的基于高斯混合概率密度的数据处理方法,其特征在于,当所述信度大于所述预设信度时,在所述输出所述端点检测时间节点和所述端点检测次数之前,还包括:判断所述端点检测帧序列中的端点检测变量的个数是否为1;若是,则进入所述输出所述端点检测时间节点和所述端点检测次数的步骤;若否,则融合多个所述端点检测变量对应的所述端点检测时间节点。5.根据权利要求2所述的基于高斯混合概率密度的数...

【专利技术属性】
技术研发人员:祝震杰陈为薛攀
申请(专利权)人:杭州鲸道科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1