【技术实现步骤摘要】
一种基于LapSVM实现音频分段打标签的方法
[0001]本专利技术涉及人工智能
,尤其涉及一种基于LapSVM实现音频分段打标签的方法。
技术介绍
[0002]图像、音频、文字是最常见的信息表现方式,涵盖了视觉、听觉、思维表述等多个维度。当今社会已经进入了数字化时代,随着网络通信技术的普及和性能的不断提升,人们对信息的需求不再局限于早期文本和静态图像,其中高清图像、视频、音频等多媒体数据已经成为信息交互的主流。
[0003]数据打标签是常用的数据处理技术,为不同种类的数据赋予带语义的标签信息,让数据可以被更好的组织、管理,还能提升统计、检索、分析时的效率,方便对数据进行深层次价值的挖掘,特别在当前的各种互联网应用场景中都有涉及,比如在文库应用中为文档增加主题和关键词标签,让用户可根据关键词进行检索、通过主题推荐相关的文档;视频网站为视频增加标签,可实现为用于推荐相同视频的功能。音频数据作为最常用的多媒体数据之一,对音频数据打标签的技术也很多,目前音频打标签基本是为整篇做标记,如果可以为内容做标签,将标记范围精 ...
【技术保护点】
【技术特征摘要】
1.一种基于LapSVM实现音频分段打标签的方法,其特征在于,过程包括:a:音频预处理;b:分段取样;c:特征提取;d:模型训练;e:模型预测;f:模型细化;g:模型合并;h:输出标签结果。2.根据权利要求1所述的方法,其特征在于,a:音频预处理,包含3个步骤:1)音频数据解析,转换为16位音频信号;2)删除噪声,分别使用傅立叶去噪声法删除背景噪音、使用维纳滤波降噪删除语音噪声;3)频谱图生成。3.根据权利要求1所述的方法,其特征在于,b:分段取样,按照每N秒为单位的方式进行分段取样。4.根据权利要求1所述的方法,其特征在于,c:特征提取,使用MFCC算法对提取音频数据的特征,在传统mfcc算法的基础上增加前补帧和后补帧两个过程。5.根据权利要求1所述的方法,其特征在于,d:模型训练,训练音频样本集的过程:预处理=>分段取样=>特征提取=>降维=>训练=>保存模型;降维算法采用PCA(Princip...
【专利技术属性】
技术研发人员:解一豪,张烈帅,李明明,魏静如,潘心冰,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。