一种基于LapSVM实现音频分段打标签的方法技术

技术编号：33708256 阅读：23 留言：0更新日期：2022-06-06 08:35

本发明专利技术提供一种基于LapSVM实现音频分段打标签的方法，属于人工智能技术领域，过程包括：音频预处理、音频分段、特征提取、降维、模型训练、二次降维、标签结果细化、标签合并。本发明专利技术利用LapSvm分类算法的优点，改进传统的音频打标签方式，让其可支持对音频数据按时间段进行识别，自动分段打标签，并且可支持细粒度的标签预测。标签预测。标签预测。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于LapSVM实现音频分段打标签的方法

[0001]本专利技术涉及人工智能
，尤其涉及一种基于LapSVM实现音频分段打标签的方法。

技术介绍

[0002]图像、音频、文字是最常见的信息表现方式，涵盖了视觉、听觉、思维表述等多个维度。当今社会已经进入了数字化时代，随着网络通信技术的普及和性能的不断提升，人们对信息的需求不再局限于早期文本和静态图像，其中高清图像、视频、音频等多媒体数据已经成为信息交互的主流。
[0003]数据打标签是常用的数据处理技术，为不同种类的数据赋予带语义的标签信息，让数据可以被更好的组织、管理，还能提升统计、检索、分析时的效率，方便对数据进行深层次价值的挖掘，特别在当前的各种互联网应用场景中都有涉及，比如在文库应用中为文档增加主题和关键词标签，让用户可根据关键词进行检索、通过主题推荐相关的文档；视频网站为视频增加标签，可实现为用于推荐相同视频的功能。音频数据作为最常用的多媒体数据之一，对音频数据打标签的技术也很多，目前音频打标签基本是为整篇做标记，如果可以为内容做标签，将标记范围精...

【技术保护点】

【技术特征摘要】
1.一种基于LapSVM实现音频分段打标签的方法，其特征在于，过程包括：a：音频预处理；b：分段取样；c：特征提取；d：模型训练；e：模型预测；f：模型细化；g：模型合并；h：输出标签结果。2.根据权利要求1所述的方法，其特征在于，a：音频预处理，包含3个步骤：1)音频数据解析，转换为16位音频信号；2)删除噪声，分别使用傅立叶去噪声法删除背景噪音、使用维纳滤波降噪删除语音噪声；3)频谱图生成。3.根据权利要求1所述的方法，其特征在于，b：分段取样，按照每N秒为单位的方式进行分段取样。4.根据权利要求1所述的方法，其特征在于，c：特征提取，使用MFCC算法对提取音频数据的特征，在传统mfcc算法的基础上增加前补帧和后补帧两个过程。5.根据权利要求1所述的方法，其特征在于，d：模型训练，训练音频样本集的过程：预处理＝>分段取样＝>特征提取＝>降维＝>训练＝>保存模型；降维算法采用PCA(Princip...

【专利技术属性】
技术研发人员：解一豪，张烈帅，李明明，魏静如，潘心冰，
申请(专利权)人：浪潮云信息技术股份公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人