The invention provides a method and a device for establishing a lyric sentiment classification model, which includes: acquiring Lyric samples marked with emotional types; acquiring various types of emotional lyrics by using the Lyric samples; establishing the feature vectors of the lyric samples by using various types of emotional lyrics; and machine learning the feature vectors of the lyric samples to obtain the feature vectors for use in the Lyric samples. Classification model of lyric emotion classification. By the above way, the classification model obtained by the present invention can be used to automatically determine the feelings of songs and improve the accuracy of song recommendation.
【技术实现步骤摘要】
一种建立歌词感情分类模型的方法及装置
本专利技术涉及自然语言处理技术,特别涉及一种建立歌词感情分类模型的方法及装置。
技术介绍
随着互联网的发展,音乐网站提供的在线听歌或歌曲下载的服务已经不能满足用户需要,很多用户还希望音乐网站能够根据自己的行为推荐与自己偏好相关的歌曲。音乐网站想要向用户推荐适宜的歌曲,依赖于对数据库中的歌曲进行准确地分类,目前对歌曲进行感情上的分类,主要依赖人工进行,不仅工作量大,而且带有很强的主观色彩,不同人分类的结果可能是不一样的。
技术实现思路
本专利技术所要解决的技术问题是提供一种建立歌词感情分类模型的方法及装置,以实现对歌曲进行自动感情分析,向用户准确推荐歌曲的目的。本专利技术为解决技术问题而采用的技术方案是提供一种建立歌词感情分类模型的方法,包括:获取标注了感情类型的歌词样本;利用所述歌词样本获取各类型的感情词库;利用各类型的感情词库建立所述歌词样本的特征向量;对所述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型。根据本专利技术之一优选实施例,利用所述歌词样本获取各类型的感情词库的步骤包括:针对每一类型的歌词样本构成的样本集合,将该样本集合中出现频率超过第一阈值的实词作为该类型的种子感情词;针对每一类型的歌词样本构成的样本集合,将该样本集合中与种子感情词共同出现在相同歌词样本中的频率超过第二阈值的实词作为该类型的第一扩展感情词。根据本专利技术之一优选实施例,利用所述歌词样本获取各类型的感情词库的步骤进一步包括:将种子感情词或第一扩展感情词作为搜索引擎的关键词以获取搜索结果,并确定在所述搜索结果 ...
【技术保护点】
1.一种建立歌词感情分类模型的方法,包括:获取标注了感情类型的歌词样本;利用所述歌词样本获取各类型的感情词库;利用各类型的感情词库建立所述歌词样本的特征向量;对所述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型,利用各类型的感情词库建立歌词样本X的特征向量的步骤包括:利用所述歌词样本X对应的歌曲旋律确定所述歌词样本X的高潮片段;根据所述歌词样本X的高潮片段中的分句确定所述歌词样本X的特征向量的分量权重,其中一个分句对应一个分量权重,并且,该分句中词语属于哪个类型的感情词库,就按照与哪个类型的感情词库相对应的第一权重调整规则对该分句对应的分量权重进行调整,所述第一权重调整规则包括:对含有高兴类型的感情词库中词语的分句对应的分量权重进行加权;以及,对含有悲伤类型的感情词库中词语的分句对应的分量权重进行降权。
【技术特征摘要】
1.一种建立歌词感情分类模型的方法,包括:获取标注了感情类型的歌词样本;利用所述歌词样本获取各类型的感情词库;利用各类型的感情词库建立所述歌词样本的特征向量;对所述歌词样本的特征向量进行机器学习,以得到用于对歌词感情进行分类的分类模型,利用各类型的感情词库建立歌词样本X的特征向量的步骤包括:利用所述歌词样本X对应的歌曲旋律确定所述歌词样本X的高潮片段;根据所述歌词样本X的高潮片段中的分句确定所述歌词样本X的特征向量的分量权重,其中一个分句对应一个分量权重,并且,该分句中词语属于哪个类型的感情词库,就按照与哪个类型的感情词库相对应的第一权重调整规则对该分句对应的分量权重进行调整,所述第一权重调整规则包括:对含有高兴类型的感情词库中词语的分句对应的分量权重进行加权;以及,对含有悲伤类型的感情词库中词语的分句对应的分量权重进行降权。2.根据权利要求1所述的方法,其特征在于,利用所述歌词样本获取各类型的感情词库的步骤包括:针对每一类型的歌词样本构成的样本集合,将该样本集合中出现频率超过第一阈值的实词作为该类型的种子感情词;针对每一类型的歌词样本构成的样本集合,将该样本集合中与种子感情词共同出现在相同歌词样本中的频率超过第二阈值的实词作为该类型的第一扩展感情词。3.根据权利要求2所述的方法,其特征在于,利用所述歌词样本获取各类型的感情词库的步骤进一步包括:将种子感情词或第一扩展感情词作为搜索引擎的关键词以获取搜索结果,并确定在所述搜索结果中出现频率超过第三阈值的候选实词,当所述候选实词与所述关键词之间的编辑距离不超过第四阈值时,将所述候选实词作为所述关键词所属类型的第二扩展感情词。4.根据权利要求1所述的方法,其特征在于,利用各类型的感情词库建立歌词样本X的特征向量的步骤进一步包括:确定所述歌词样本X的高潮片段中的分句是否还包含预设类型的辅助词库中的词语,如果是,则按照与该类型的辅助词库相对应的第二权重调整规则对该分句对应的分量权重进行调整,所述第二权重调整规则包括:对含有否定类型的辅助词库中词语的分句对应的分量权重进行降权;以及,对含有修饰类型的辅助词库中词语的分句对应的分量权重,若所述第一权重调整规则使得该分量权重增加,则对该分量权重进行加权,否则对该分量权重进行降权。5.一种建立歌词感情分类模型的装置,包括:接收单元...
【专利技术属性】
技术研发人员:薛晓旭,
申请(专利权)人:北京音之邦文化科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。