【技术实现步骤摘要】
一种基于ShuffleNet的中文歌词情感分析方法
[0001]本专利技术属于自然语言处理领域,具体的说是涉及一种新的基于 ShuffleNet和情感词典的中文歌词情感分析方法。
技术介绍
[0002]近年来,随着计算机与互联网的迅猛发展。音频、图像、文本等多媒体 数据呈爆炸性增长,歌曲便是其中之一。歌曲作为人们的情感载体之一,已 成为人们生活中不可或缺的一部分。如何有效的解决在线音乐资源检索、管 理和歌曲推荐等问题已成为一项难题。因此需要一种高效并且准确的方法对 歌曲进行情感分析,从而达到分类目的。
[0003]在歌曲数量不多的情况下,歌曲分类可采用人工的方式进行,这种方式 虽然准确率高,但是效率却很低。因此,需要借助计算机来自动的进行分类。 近年来,歌曲的种类层出不穷,从以往的古典音乐到如今的流行音乐,歌曲 的形式已发现翻天覆地的变化。在以往,音频相较于歌词是更加重要的衡量 歌曲情感的因素。现如今歌词内容愈发丰富,并已成为众多流行音乐作者的 一个非常重要的情感抒发途径。因此,基于歌词对歌曲进行情感分析来对歌 曲分 ...
【技术保护点】
【技术特征摘要】
1.一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:所述情感分析方法包括如下步骤:步骤1:对歌词文本数据集进行预处理,去除文本中的无用信息;步骤2:将经过步骤1之后得到数据通过使用jieba分词工具对歌词文本进行分词并去除停用词;步骤3:对分词之后的结果进行词嵌入,将其转换为向量的形式;步骤4:构建ShuffleNet网络,将步骤3得到的结果通过ShuffleNet网络,并将输出的结果通过激活函数得到score1;步骤5:构建歌曲情感词典;步骤6:将步骤2得到的分词之后的结果通过步骤5构建的情感词典和相应的计算规则计算出情感得分,并通过softmax函数得到score2;步骤7:将经过步骤4和步骤6得到的score1和score2通过D
‑
S证据理论进行融合,从而得出最终情感得分。2.根据权利要求1所述一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:在所述步骤4中具体包括如下步骤:步骤4
‑
1:将步骤3得到的词嵌入结果进行resize,将其固定为大小为256
×
256的矩阵;步骤4
‑
2:在ShuffleNet的输入层进行一次卷积转为3通道的输入;步骤4
‑
3:开始构建ShuffleNet网络,ShuffleNet网络由两种模块组合而成;步骤4
‑
4:构建完成之后得到输出的结果为一个向量,将其通过激活函数,转换为0到1区间的值score1。3.根据权利要求1所述一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:所述步骤5构建歌曲情感词典具体包括如下步骤:步骤5
‑
1:构建程度副词词典:根据知网(Hownet)情感词典来构建程度副词,并将其分为极高、高、中、低3类,权值分别为2、1.75、1.5、1.25;步骤5
‑
2:构建否定词典:收集否定词,将否定词权重设为
‑
1,并且当文本中否定词的个数为奇数时,表示该文本为否定,当文本中的否定词个数为偶数时,表示该文本为肯定;步骤5
‑
3:构建歌词情感词典:将音乐...
【专利技术属性】
技术研发人员:谢强,林巧民,沈慧琳,周斌,洪磊,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。