一种建立歌词感情分类模型的方法及装置制造方法及图纸

技术编号:20291546 阅读:37 留言:0更新日期:2019-02-10 22:33
本发明专利技术提供了一种建立歌词感情分类模型的方法及装置,其中所述方法包括:获取标注了感情类型的歌词样本;利用所述歌词样本获取各类型的感情词库;利用各类型的感情词库建立所述歌词样本的特征向量;对所述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型。通过上述方式,本发明专利技术得到的分类模型能够用于自动确定歌曲的感情,提高歌曲推荐的准确性。

A Method and Device for Establishing the Classification Model of Lyrics Emotion

The invention provides a method and a device for establishing a lyric sentiment classification model, which includes: acquiring Lyric samples marked with emotional types; acquiring various types of emotional lyrics by using the Lyric samples; establishing the feature vectors of the lyric samples by using various types of emotional lyrics; and machine learning the feature vectors of the lyric samples to obtain the feature vectors for use in the Lyric samples. Classification model of lyric emotion classification. By the above way, the classification model obtained by the present invention can be used to automatically determine the feelings of songs and improve the accuracy of song recommendation.

【技术实现步骤摘要】
一种建立歌词感情分类模型的方法及装置
本专利技术涉及自然语言处理技术,特别涉及一种建立歌词感情分类模型的方法及装置。
技术介绍
随着互联网的发展,音乐网站提供的在线听歌或歌曲下载的服务已经不能满足用户需要,很多用户还希望音乐网站能够根据自己的行为推荐与自己偏好相关的歌曲。音乐网站想要向用户推荐适宜的歌曲,依赖于对数据库中的歌曲进行准确地分类,目前对歌曲进行感情上的分类,主要依赖人工进行,不仅工作量大,而且带有很强的主观色彩,不同人分类的结果可能是不一样的。
技术实现思路
本专利技术所要解决的技术问题是提供一种建立歌词感情分类模型的方法及装置,以实现对歌曲进行自动感情分析,向用户准确推荐歌曲的目的。本专利技术为解决技术问题而采用的技术方案是提供一种建立歌词感情分类模型的方法,包括:获取标注了感情类型的歌词样本;利用所述歌词样本获取各类型的感情词库;利用各类型的感情词库建立所述歌词样本的特征向量;对所述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型。根据本专利技术之一优选实施例,利用所述歌词样本获取各类型的感情词库的步骤包括:针对每一类型的歌词样本构成的样本集合,将该样本集合中出现频率超过第一阈值的实词作为该类型的种子感情词;针对每一类型的歌词样本构成的样本集合,将该样本集合中与种子感情词共同出现在相同歌词样本中的频率超过第二阈值的实词作为该类型的第一扩展感情词。根据本专利技术之一优选实施例,利用所述歌词样本获取各类型的感情词库的步骤进一步包括:将种子感情词或第一扩展感情词作为搜索引擎的关键词以获取搜索结果,并确定在所述搜索结果中出现频率超过第三阈值的候选实词,当所述候选实词与所述关键词之间的编辑距离不超过第四阈值时,将所述候选实词作为所述关键词所属类型的第二扩展感情词。根据本专利技术之一优选实施例,利用各类型的感情词库建立歌词样本X的特征向量的步骤包括:利用所述X对应的歌曲旋律确定所述X的高潮片段;根据所述X的高潮片段中的分句确定所述X的特征向量的分量权重,其中一个分句对应一个分量权重,并且,该分句中词语属于哪个类型的感情词库,就按照与哪个类型的感情词库相对应的第一权重调整规则对该分句对应的分量权重进行调整。根据本专利技术之一优选实施例,利用各类型的感情词库建立歌词样本X的特征向量的步骤进一步包括:确定所述X的高潮片段中的分句是否还包含预设类型的辅助词库中的词语,如果是,则按照与该类型的辅助词库相对应的第二权重调整规则对该分句对应的分量权重进行调整。根据本专利技术之一优选实施例,所述第一权重调整规则包括:对含有高兴类型的感情词库中词语的分句对应的分量权重进行加权;以及,对含有悲伤类型的感情词库中词语的分句对应的分量权重进行降权。根据本专利技术之一优选实施例,所述第二权重调整规则包括:对含有否定类型的辅助词库中词语的分句对应的分量权重进行降权;以及,对含有修饰类型的辅助词库中词语的分句对应的分量权重,若所述第一权重调整规则使得该分量权重增加,则对该分量权重进行加权,否则对该分量权重进行降权。本专利技术提供了一种建立歌词感情分类模型的装置,包括:接收单元,用于获取标注了感情类型的歌词样本;词库建立单元,用于利用所述歌词样本获取各类型的感情词库;向量建立单元,用于利用各类型的感情词库建立所述歌词样本的特征向量;训练单元,用于对所述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型。根据本专利技术之一优选实施例,所述词库建立单元包括:种子词获取单元,用于针对每一类型的歌词样本构成的样本集合,将该样本集合中出现频率超过第一阈值的词语作为该类型的种子感情词;第一扩展词获取单元,用于针对每一类型的歌词样本构成的样本集合,将该样本集合中与种子感情词共同出现在相同歌词样本中的频率超过第二阈值的实词作为该类型的第一扩展感情词。根据本专利技术之一优选实施例,所述词库建立单元进一步包括:第二扩展词获取单元,用于将种子感情词或第一扩展感情词作为搜索引擎的关键词以获取搜索结果,并确定在所述搜索结果中出现频率超过第三阈值的候选实词,当所述候选实词与所述关键词之间的编辑距离不超过第四阈值时,将所述候选实词作为所述关键词所属类型的第二扩展感情词。根据本专利技术之一优选实施例,所述向量建立单元包括:高潮提取单元,用于建立歌词样本X的特征向量时,利用所述X对应的歌词旋律确定所述X的高潮片段;第一权重单元,用于根据所述X中高潮片段中的分句确定所述X的特征向量的分量权重,其中一个分句对应一个分量权重,并且,该分句中词语属于哪个类型的感情词库,就按照与哪个类型的感情词库相对应的第一权重调整规则对该分句对应的分量权重进行调整。根据本专利技术之一优选实施例,所述向量建立单元进一步包括:第二权重单元,用于确定所述X的高潮片段中的分句是否还包含预设类型的辅助词库中的词语,如果是,则按照与该类型的辅助词库相对应的第二权重调整规则对该分句对应的分量权重进行调整。根据本专利技术之一优选实施例,所述第一权重调整规则包括:对含有高兴类型的感情词库中词语的分句对应的分量权重进行加权;以及,对含有悲伤类型的感情词库中词语的分句对应的分量权重进行降权。根据本专利技术之一优选实施例,所述第二权重调整规则包括:对含有否定类型的辅助词库中词语的分句对应的分量权重进行降权;以及,对含有修饰类型的辅助词库中词语的分句对应的分量权重,若所述第一权重调整规则使得该分量权重增加,则对该分量权重进行加权,否则对该分量权重进行降权。由以上技术方案可以看出,本专利技术利用歌词样本,可以获取到感情词库,利用感情词库,可以将歌词样本特征化,从而训练出可用于对歌词感情进行分类的分类模型。本专利技术采用了文本分析的方法,建立起基于歌词的分类模型,该分类模型可以自动地对未知类型的歌词进行分类,从而确定与歌词相对应的歌曲的感情类型。将本专利技术应用到歌曲推荐中,能够显著提高歌曲推荐的准确性。【附图说明】图1为本专利技术中建立歌词感情分类模型的方法的实施例的流程示意图;图2为本专利技术中建立歌词感情分类模型的装置的实施例的结构示意框图;图3为本专利技术中词库建立单元202的一个实施例的结构示意框图;图4为本专利技术中词库建立单元202的又一个实施例的结构示意框图;图5为本专利技术中向量建立单元203的一个实施例的结构示意框图;图6为本专利技术中向量建立单元203的又一个实施例的结构示意框图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。请参考图1,图1为本专利技术中建立歌词感情分类模型的方法的实施例的流程示意图。如图1所示,该实施例包括:步骤S1:获取标注了感情类型的歌词样本。步骤S2:利用上述歌词样本获取各类型的感情词库。步骤S3:利用各类型的感情词库建立上述歌词样本的特征向量。步骤S4:对上述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型。下面对上述步骤进行详细介绍。歌词样本是以完整的一首歌词为单位进行划分的,例如歌曲《只对你有感觉》的歌词就是一个歌词样本。本实施例中的歌词样本指的是已经标注了感情类型的歌词。例如《只对你有感觉》的感情类型是高兴类型,《甜甜的》的感情类型是高兴类型,《突然好想你》的感情类型是悲伤类型等等。在一个实施例中,步骤S2具体包括步骤本文档来自技高网...

【技术保护点】
1.一种建立歌词感情分类模型的方法,包括:获取标注了感情类型的歌词样本;利用所述歌词样本获取各类型的感情词库;利用各类型的感情词库建立所述歌词样本的特征向量;对所述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型,利用各类型的感情词库建立歌词样本X的特征向量的步骤包括:利用所述歌词样本X对应的歌曲旋律确定所述歌词样本X的高潮片段;根据所述歌词样本X的高潮片段中的分句确定所述歌词样本X的特征向量的分量权重,其中一个分句对应一个分量权重,并且,该分句中词语属于哪个类型的感情词库,就按照与哪个类型的感情词库相对应的第一权重调整规则对该分句对应的分量权重进行调整,所述第一权重调整规则包括:对含有高兴类型的感情词库中词语的分句对应的分量权重进行加权;以及,对含有悲伤类型的感情词库中词语的分句对应的分量权重进行降权。

【技术特征摘要】
1.一种建立歌词感情分类模型的方法,包括:获取标注了感情类型的歌词样本;利用所述歌词样本获取各类型的感情词库;利用各类型的感情词库建立所述歌词样本的特征向量;对所述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型,利用各类型的感情词库建立歌词样本X的特征向量的步骤包括:利用所述歌词样本X对应的歌曲旋律确定所述歌词样本X的高潮片段;根据所述歌词样本X的高潮片段中的分句确定所述歌词样本X的特征向量的分量权重,其中一个分句对应一个分量权重,并且,该分句中词语属于哪个类型的感情词库,就按照与哪个类型的感情词库相对应的第一权重调整规则对该分句对应的分量权重进行调整,所述第一权重调整规则包括:对含有高兴类型的感情词库中词语的分句对应的分量权重进行加权;以及,对含有悲伤类型的感情词库中词语的分句对应的分量权重进行降权。2.根据权利要求1所述的方法,其特征在于,利用所述歌词样本获取各类型的感情词库的步骤包括:针对每一类型的歌词样本构成的样本集合,将该样本集合中出现频率超过第一阈值的实词作为该类型的种子感情词;针对每一类型的歌词样本构成的样本集合,将该样本集合中与种子感情词共同出现在相同歌词样本中的频率超过第二阈值的实词作为该类型的第一扩展感情词。3.根据权利要求2所述的方法,其特征在于,利用所述歌词样本获取各类型的感情词库的步骤进一步包括:将种子感情词或第一扩展感情词作为搜索引擎的关键词以获取搜索结果,并确定在所述搜索结果中出现频率超过第三阈值的候选实词,当所述候选实词与所述关键词之间的编辑距离不超过第四阈值时,将所述候选实词作为所述关键词所属类型的第二扩展感情词。4.根据权利要求1所述的方法,其特征在于,利用各类型的感情词库建立歌词样本X的特征向量的步骤进一步包括:确定所述歌词样本X的高潮片段中的分句是否还包含预设类型的辅助词库中的词语,如果是,则按照与该类型的辅助词库相对应的第二权重调整规则对该分句对应的分量权重进行调整,所述第二权重调整规则包括:对含有否定类型的辅助词库中词语的分句对应的分量权重进行降权;以及,对含有修饰类型的辅助词库中词语的分句对应的分量权重,若所述第一权重调整规则使得该分量权重增加,则对该分量权重进行加权,否则对该分量权重进行降权。5.一种建立歌词感情分类模型的装置,包括:接收单元...

【专利技术属性】
技术研发人员:薛晓旭
申请(专利权)人:北京音之邦文化科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1