一种智能语音音频筛选系统技术方案

技术编号:34805034 阅读:108 留言:0更新日期:2022-09-03 20:12
本发明专利技术公开了一种智能语音音频筛选系统,包括:获取模块、识别模块、提取模块、筛选模块和打分模块;所述获取模块用于获取目标语音音频的音频信息;所述识别模块用于识别所述目标语音音频的音频信息,获取所述目标语音音频的音频特征;所述提取模块用于对所述音频特征进行特征提取,获取第一语音音频的音频特征;所述筛选模块用于对所述第一语音音频的音频特征与所述目标语音音频的音频特征进行阈值筛选,将符合阈值的所述第一语音音频的音频特征划分为合格语音音频;所述打分模块用于对所述合格语音音频进行打分。本发明专利技术提高了筛选语音音频的速度和准确性。音频的速度和准确性。音频的速度和准确性。

【技术实现步骤摘要】
一种智能语音音频筛选系统


[0001]本专利技术属于筛选音频
,尤其涉及一种智能语音音频筛选系统。

技术介绍

[0002]随着互联网时代的快速发展,现在语音识别在多媒体检、字幕自动匹配、视频内容分析、手机智能助手等等应用上已经得到了广泛的应用,但是这些应用中,有一部分应用的没有实现商用,主要原因是它们必须先从一段多类型音频中识别出纯语音,然后才能针对纯语音部分进行语音识别。在音频分类领域很多人进行了研究,但是提取的特征过多,并且一般是用统计学习等方法识别出纯语音这种类型,其实时性难以满足需求。在多类型音频中,有一部分是以纯语音为主的,譬如科普视频的讲解伴音,广播音频等等,这类音频的纯语音多,并且带有伴奏的语音其伴奏一般是连续的古典音乐,因此短暂的静音停顿只会在纯语音部分出现。而不同的音频中静音停顿会各不相同,利用音频中静音停顿的不同,可实现音频的快速筛选分类,而现有的音频分类中没有利用上述的特征进行筛选音频的方法。

技术实现思路

[0003]本专利技术的目的在于提出一种智能语音音频筛选系统,提高了筛选音频的速度和准确度。
[0004]为实现上述目的,本专利技术提供了一种智能语音音频筛选系统,包括:获取模块、识别模块、提取模块、筛选模块和打分模块;
[0005]所述获取模块用于获取目标语音音频的音频信息;
[0006]所述识别模块用于识别所述目标语音音频的音频信息,获取所述目标语音音频的音频特征;
[0007]所述提取模块用于对所述音频特征进行特征提取,获取第一语音音频的音频特征;
[0008]所述筛选模块用于对所述第一语音音频的音频特征与所述目标语音音频的音频特征进行阈值筛选,将符合阈值的所述第一语音音频的音频特征划分为合格语音音频;
[0009]所述打分模块用于对所述合格语音音频进行打分。
[0010]可选的,所述获取目标语音音频的音频信息包括读取的视频信息,并提取视频数据中的音频信息。
[0011]可选的,所述识别模块包括去噪单元和分帧单元,
[0012]所述去噪单元用于对所述目标语音音频的音频信息进行去噪处理,获取纯净的音频信息;
[0013]所述分帧单元用于对所述纯净的音频信息进行分帧处理,基于所述纯净的音频信息进行降采样、预加重、加窗和分帧处理,获取所述目标语音音频的音频特征。
[0014]可选的,所述提取模块包括标注单元和排序单元;
[0015]所述标注单元用于所述目标语音音频的音频特征进行标注处理,获取第一标识;
[0016]所述排序单元用于对标注处理后的所述目标语音音频的音频特征进行排序,获取排序列表。
[0017]可选的,所述提取模块具体为:将所述目标语音音频的音频特征进行标注处理,音频运行时将每一个音频特征进行标注,并将按照第一个音频标注为第一标识的处理方法对每一个音频按照以1为单位递增的方式进行音频标注,并将第一标识记为排序列表中的第一个对应关系,第二标识对应排序列表中的第二个对应关系,依照对应关系将列表按照顺序进行填充。
[0018]可选的,所述提取模块还包括纠察单元,所述纠察单元用于修改和检查所述排序列表中的音频标注和列表顺序的对应关系,修改音频标注和列表顺序保持一致,修改后对存储的排序列表进行更新。
[0019]可选的,所述筛选模块将所述第一语音音频的音频特征与所述目标语音音频的音频特征进行阈值筛选,获取合格语音音频,包括:
[0020]对所述第一语音音频的音频特征进行特征打分处理,获取第一语音音频的特征值;
[0021]对所述目标语音音频的音频特征进行特征打分,获取目标语音音频的特征值;
[0022]所述第一语音音频的特征值和所述目标语音音频的特征值对应同一类特征,进行阈值筛选处理,将所述第一语音音频的特征值与所述阈值进行对比,所述第一语音音频的特征值符合阈值筛选时,则所述第一语音音频的特征值为合格语音音频,将所述目标语音音频的特征值与所述第一语音音频的特征值进行阈值对比筛选,判断所述目标语音音频的特征值是否为合格语音音频,获取合格语音音频数据库。
[0023]可选的,所述打分模块设置评分维度,所述评分维度包括关键词覆盖率、语义覆盖率、质检差错值、语量、字错率和停顿频率标记;获取模型对应的评分维度,每个评分维度均对应一个预设分,将模型对应的评分维度与所有评分维度进行匹配获取得到对应的预设分,将模型匹配到的所有预设分进行求和得到总分。
[0024]本专利技术技术效果:本专利技术公开了一种智能语音音频筛选系统,目标语音音频的音频信息,对获取的目标语音音频的音频信息进行去噪和分帧处理进行特征识别,对识别后的音频特征进行标注和排序进行特征提取处理,对处理获得音频特征进行纠察处理并更新排序列表,对所述第一语音音频的音频特征与所述目标语音音频的音频特征设定阈值筛选,获取合格语音音频,提高了语音音频的速度和准确度。
附图说明
[0025]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0026]图1为本专利技术实施例智能语音音频筛选系统的结构示意图。
具体实施方式
[0027]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0028]需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的
计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0029]如图1所示,本实施例中提供一种智能语音音频筛选系统,包括:
[0030]获取模块、识别模块、提取模块、筛选模块和打分模块;
[0031]所述获取模块用于获取目标语音音频的音频信息;
[0032]所述识别模块用于识别所述目标语音音频的音频信息,获取所述目标语音音频的音频特征;
[0033]所述提取模块用于对所述音频特征进行特征提取,获取第一语音音频的音频特征;
[0034]所述筛选模块用于对所述第一语音音频的音频特征与所述目标语音音频的音频特征进行阈值筛选,将符合阈值的所述第一语音音频的音频特征划分为合格语音音频;
[0035]所述打分模块用于对所述合格语音音频进行打分。
[0036]进一步优化方案,所述获取目标语音音频的音频信息包括读取的视频信息,并提取视频数据中的音频信息。
[0037]进一步优化方案,所述识别模块包括去噪单元和分帧单元,
[0038]所述去噪单元用于对所述目标语音音频的音频信息进行去噪处理,获取纯净的音频信息;
[0039]所述分帧单元用于对所述纯净的音频信息进行分帧处理,基于所述纯净的音频信息进行降采样、预加重、加窗和分帧处理,获取所述目标语音音频的音频特征。
[0040]所述识别模块包括去噪器和分帧器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能语音音频筛选系统,其特征在于,包括:获取模块、识别模块、提取模块、筛选模块和打分模块;所述获取模块用于获取目标语音音频的音频信息;所述识别模块用于识别所述目标语音音频的音频信息,获取所述目标语音音频的音频特征;所述提取模块用于对所述音频特征进行特征提取,获取第一语音音频的音频特征;所述筛选模块用于对所述第一语音音频的音频特征与所述目标语音音频的音频特征进行阈值筛选,将符合阈值的所述第一语音音频的音频特征划分为合格语音音频;所述打分模块用于对所述合格语音音频进行打分。2.如权利要求1所述的智能语音音频筛选系统,其特征在于,所述获取目标语音音频的音频信息包括读取的视频信息,并提取视频数据中的音频信息。3.如权利要求1所述的智能语音音频筛选系统,其特征在于,所述识别模块包括去噪单元和分帧单元,所述去噪单元用于对所述目标语音音频的音频信息进行去噪处理,获取纯净的音频信息;所述分帧单元用于对所述纯净的音频信息进行分帧处理,基于所述纯净的音频信息进行降采样、预加重、加窗和分帧处理,获取所述目标语音音频的音频特征。4.如权利要求1所述的智能语音音频筛选系统,其特征在于,所述提取模块包括标注单元和排序单元;所述标注单元用于所述目标语音音频的音频特征进行标注处理,获取第一标识;所述排序单元用于对标注处理后的所述目标语音音频的音频特征进行排序,获取排序列表。5.如权利要求4所述的智能语音音频筛选系统,其特征在于,所述提取模块具体为:将所述目标语音音频的音频特征进行标注处理,音频运行时将每一个音频特征进行标注,并将按照第一个音频标注为第一标识的处理方法对每一个音频按照...

【专利技术属性】
技术研发人员:杭波赵卓鹏屈俊峰熊金准种欢王普朱丽花俏枝王峰张军毛华庆黄小童孙成娇张勇
申请(专利权)人:湖北文理学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1