情感标注的方法及其系统技术方案

技术编号：18302114 阅读：269 留言：0更新日期：2018-06-28 12:01

本发明专利技术提供一种情感标注的方法及其系统，该方法包括：接收待标注的音频数据；采用预训练的至少一个训练模型对待标注的音频数据进行分析，将待标注的音频数据转换为声谱图，以确定待标注的音频数据的情感标签；为待标注的音频数据进行情感标注。将待识别音频数据通过预先训练的训练模型，将音频数据转化为声谱图识别，对音频数据的情感进行标注，实现了音频数据的自动化情感分类，降低了学习成本，缩短了开发周期。

The method and system of emotional annotation

The invention provides an emotional annotation method and its system. The method includes: receiving the audio data to be annotated, analyzing the audio data with at least one training model in pre training, converting the annotated audio data into a sonogram to determine the emotional label of the audio data to be labeled; Annotated audio data for emotional annotation. The audio data is converted to sound spectrum recognition by pre training training model, and the emotion of audio data is annotated. The automatic emotion classification of audio data is realized, the learning cost is reduced and the development cycle is shortened.

全部详细技术资料下载

【技术实现步骤摘要】
情感标注的方法及其系统
本专利技术涉及数据分析
，尤其设计一种情感标注的方法及其系统。
技术介绍
音乐情感的自动标注涉及到音乐理论、心理学、信号处理、模式识别、数据挖掘等相关的知识，但专业跨度大，自动识别过程复杂，且对技术人员的设计过程要求过高。
技术实现思路
本专利技术提供一种情感标注的方法及其系统，通过将音频数据的识别转化为图像识别，完成了歌曲情感的自动化标注，降低了学习成本，缩短了开发周期。第一方面，本专利技术实施例提供一种情感标注的方法，该方法包括：接收待标注的音频数据；采用预训练的至少一个训练模型对待标注的音频数据进行分析，将待标注的音频数据转换为声谱图，以确定待标注的音频数据的情感标签；为待标注的音频数据进行情感标注。将待识别音频数据通过预先训练的训练模型，将音频数据转化为声谱图识别，对音频数据的情感进行标注，实现了音频数据的自动化情感分类，降低了学习成本，缩短了开发周期。可选地，在采用预训练的至少一个训练模型对待标注的音频数据进行分析，确定待标注的音频数据的情感标签之前，方法还包括：按照至少一个情感标签获取每个情感标签对应的训练集，训练集包括多个待...
情感标注的方法及其系统

【技术保护点】
1.一种情感标注的方法，其特征在于，所述方法包括：接收待标注的音频数据；采用预训练的至少一个训练模型对所述待标注的音频数据进行分析，确定所述待标注的音频数据的情感标签；为所述待标注的音频数据进行情感标注。

【技术特征摘要】
1.一种情感标注的方法，其特征在于，所述方法包括：接收待标注的音频数据；采用预训练的至少一个训练模型对所述待标注的音频数据进行分析，确定所述待标注的音频数据的情感标签；为所述待标注的音频数据进行情感标注。2.根据权利要求1所述的方法，其特征在于，在所述采用预训练的至少一个训练模型对所述待标注的音频数据进行分析，确定所述待标注的音频数据的情感标签之前，所述方法还包括：按照至少一个情感标签获取每个情感标签对应的训练集，所述训练集包括多个待训练音频数据；将所述训练集包括的所述多个待训练音频数据分别转换为声谱图；对所述训练集包括的所述多个待训练音频数据转换得到的每个声谱图进行模型训练，得到训练模型。3.根据权利要求2所述的方法，其特征在于，所述将所述训练集包括的所述多个待训练音频数据分别转换为声谱图，包括：将所述多个待训练音频数据分别进行傅里叶变换，得到所述多个待训练音频数据的声谱图。4.根据权利要求2或3所述的方法，其特征在于，在将所述训练集包括的所述多个待训练音频数据分别转换为声谱图之后，所述方法还包括：对所述多个待训练音频数据转换后的声谱图进行图像缩放；将缩放后的声谱图进行模型训练，得到训练模型。5.根据权利要求2所述的方法，其特征在于，该方法包括采用AlexN...

【专利技术属性】
技术研发人员：马明，
申请(专利权)人：北京酷我科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人