一种基于LDA模型的歌曲分类方法技术

技术编号:15822702 阅读:37 留言:0更新日期:2017-07-15 04:54
本发明专利技术涉及模式识别领域,介绍了一种歌曲分类的方法。该歌曲分类方法主要是将歌曲库中的所有歌曲的相对音高以及分类数目作为LDA主题模型的输入,进而对歌曲库中的所有歌曲进行分类。这里的LDA主题模型分类方法是通过每首歌曲的相对音高之间的相似度将歌曲库中所有的歌曲分成用户指定类别数目。最终可以计算出每首歌主题类别的概率分布,即p(topic

【技术实现步骤摘要】
一种基于LDA模型的歌曲分类方法
本专利技术涉及音乐与机器学习领域,具体涉及使用LDA模型根据歌曲旋律的相对音高对歌曲进行分类。
技术介绍
随着互联网技术的发展和多媒体压缩技术的进步,数字歌曲大量涌现。在这种情况下歌曲检索就变成了海量检索,对歌曲进行分类可以大幅度缩小检索的范围,提高检索的效率。传统的歌曲检索大多是根据人工标致的关键字进行检索,也就是基于文本的歌曲检索,标注的信息有歌曲的名字、歌手、专辑等。传统的分类方式也是基于文本对歌曲进行分类,比较流行的分类方式是歌手、专辑、歌词的风格、使用的乐器、演唱方法等。但是很多人在进行歌曲的搜索时常常记不得关键的文本信息。只记得歌曲内容的只言片语,更或者只记得歌曲的部分节奏等等,这些问题给歌曲检索带来诸多麻烦,并且基于文本检索在生成歌曲库的时候工作量极大。因为传统的基于文本的歌曲检索技术的诸多不便,于是出现了通过提取音频的特征信息进行检索的基于内容的歌曲检索技术。基于内容的歌曲检索技术只需用户记得部分关键信息便能进行检索,弥补了传统检索的不足。基于内容的歌曲检索所使用的关键信息有音频指纹、歌曲旋律等,这些都可从用户记住的信息中获取。哼唱检本文档来自技高网...
一种基于LDA模型的歌曲分类方法

【技术保护点】
一种基于LDA模型的歌曲分类方法,其特征在于包括步骤1.1和步骤1.2:步骤1.1:提取歌曲库中每首歌曲的相对音高集作为歌曲的标志数据用于分类;步骤1.2:基于用户输入的分类个数K与歌曲库中所有歌曲的相对音高集使用LDA模型对歌曲进行分类;步骤1.1包括以下步骤:步骤11:用户通过旋律提取算法提取出歌曲库中每首歌曲的音高集。这里音高按时间排序,可以通过设置采样频率的大小控制时间片的大小;步骤12:音高集中小于等于零的值视为无效信息;删除音高集中的无效信息,得到多个音高序列片段;步骤13:对照音高频率表去掉音高序列片段中每个音高的误差;步骤14:对每个音高片段做逆序相减运算并去掉每个音高序列片段...

【技术特征摘要】
1.一种基于LDA模型的歌曲分类方法,其特征在于包括步骤1.1和步骤1.2:步骤1.1:提取歌曲库中每首歌曲的相对音高集作为歌曲的标志数据用于分类;步骤1.2:基于用户输入的分类个数K与歌曲库中所有歌曲的相对音高集使用LDA模型对歌曲进行分类;步骤1.1包括以下步骤:步骤11:用户通过旋律提取算法提取出歌曲库中每首歌曲的音高集。这里音高按时间排序,可以通过设置采样频率的大小控制时间片的大小;步骤12:音高集中小于等于零的值视为无效信息;删除音高集中的无效信息,得到多个音高序列片段;步骤13:对照音高频率表去掉音高序列片段中每个音高的误差;步骤14:对每个音高片段做逆序相减运算并去掉每个音高序列片段的首个音高,从而得到了每首歌曲的相对音高集。其中等于零的相对音高对分类几乎没有影响,所以舍去相对音高集中等于零的相对音高;步骤15:将每首歌曲的相对音高集写入文档,每个相对音高之间以空格分开,一个段落代表一首歌曲;步骤1.2包括以下步骤:步骤21:读取文件并记录每首歌曲对应的相对音高集,扫描歌曲库中每首歌曲对应的相对音高对每个相对音高随机赋予一个小于分类个数的主题编号,记录下属于每个词分配到每一主题的频次,以...

【专利技术属性】
技术研发人员:张翔孙伟余璇
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1