当前位置: 首页 > 专利查询>苏州大学专利>正文

一种根据图片自动播放歌曲的方法及系统技术方案

技术编号:10217385 阅读:178 留言:0更新日期:2014-07-16 15:06
本发明专利技术提供一种根据图片自动播放歌曲的方法及系统,所述方法包括以下步骤。S1、对图片库中所有图片标注标签,对歌曲库中所有歌曲的歌词标注标签。S2、对图片库中所有图片进行预处理得到字典,根据所述字典重构所述图片库中所有图片。S3、扫描已经重构的图片,通过LDA得到所述图片的主题,将所述图片对应的标签添加到其自身的主题中,同时通过所述LDA得到歌曲库中歌词的主题,并将所述歌词对应的标签添加到其自身的主题中。S4、根据图片库中图片的主题得到所述图片的标签,在歌曲库中查找到标签与所述图片的标签相同的歌词,并播放对应歌曲。

【技术实现步骤摘要】
一种根据图片自动播放歌曲的方法及系统
本专利技术属于机器学习及模式识别领域,具体涉及一种根据图片自动播放歌曲的方法及系统。
技术介绍
随着信息化的迅速普及,各种类型(如文本,音频,视频等)的信息带来了信息量的急剧增加。如何将内容相近但类型不同的信息进行整合,将其根据内容进行分类,使人们在需求某一特定内容的信息时,不必受限于信息的类型,从而达到多元化信息获取的目的,目前成为亟待解决的问题。为了处理这些不同类型的信息,需要对各种类型的信息进行基于主题模型的分类。其中,LDA(LatentDirichletAllocation)主题模型算法是对文字隐含主题进行建模的方法,它是一个集合概率模型,主要用于处理离散的数据集合,目前主要用在数据挖掘和自然语言处理中,可降低维度。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。此外,PLSI(概率潜在语义索引,probabilisticlatentsemanticindexing)是一种常用的概率语义模型,它把文档中的每个词建模成混合模型中取出的一个样本。其中,混合模型中的成分是满足多项式分布的随机变量。文档中不同的词可能是由不同的语义所产生的。每个文档被表示为一系列的混合组成部分,因此降维变成了在固定集合语义上的一个概率分布。LDA模型的生成过程与PLSI在本质上是相同的。PLSI是从潜在的类模型中获取一个混合分解,它目前广泛应用于信息的检索与过滤、自然语言处理、机器学习和一些相关的领域。LDA与PLSI主要的区别在于:LDA把文档在主题上的分布以及主题在单词表上的分布都看作是随机变量,由超参进行控制;而PLSI把这两个分布都看作是参数。这导致随着训练文档数的增加,在测试集中,由训练集得出的模型可能会导致过拟合的现象。当前已有很多学者在潜在狄利克雷模型(即LDA)的基础上,通过加入标签、时间因素、作者间相关性因素、监督或无监督因素等等,做出了进一步的改进。目前,主题模型的应用覆盖了文本挖掘、信息处理、图像处理等多个领域。鉴于上述原因,本专利技术利用LDA主题模型将具有相似信息内容但是不同信息类型(图片和文本)的信息进行分类,提供了一种根据图片自动播放歌曲的方法及系统。使得用户可以边欣赏图片边倾听与图片情境相近的音乐,提高了人们的生活水平及情操修养。并且儿童可以边看图片边听到与图片主题相对应歌词的歌曲,增加对事物的认识,本专利技术对父母进行幼儿早期教育具有积极的意义。
技术实现思路
本专利技术提供一种根据图片自动播放歌曲的方法,包括以下步骤:S1、对图片库中所有图片标注标签,对歌曲库中所有歌曲的歌词标注标签;S2、对图片库中所有图片进行预处理得到字典,根据所述字典重构所述图片库中所有图片;S3、扫描已经重构的图片,通过LDA得到所述图片的主题,将所述图片对应的标签添加到其自身的主题中,同时通过所述LDA得到歌曲库中歌词的主题,并将所述歌词对应的标签添加到其自身的主题中;S4、根据图片库中图片的主题得到所述图片的标签,在歌曲库中查找到标签与所述图片的标签相同的歌词,并播放对应歌曲。优选的,步骤S1中对所述图片及歌词分别标注的标签是属于同一个集合。优选的,步骤S2中所述预处理的过程为:从图片库中的每张图片里选出N个碎片,每个碎片用SIFT向量表示,从所有的碎片里,用k-means聚类算法得到T个中心点,所述T个中心点构成字典。优选的,在步骤S3中,若图片或歌词没有对应的标签,则将所述图片或歌词主题的标签作为所述图片或歌词的标签。优选的,步骤S3中所述图片及歌词通过的LDA为相同的主题模型算法。优选的,一个标签仅属于一个主题。本专利技术还提供一种根据图片自动播放歌曲的系统,包括标签标注模块、图片预处理模块、聚类模块及匹配模块,所述标签标注模块连接图片预处理模块,所述图片预处理模块连接聚类模块,所述聚类模块连接匹配模块,所述匹配模块连接播放器,所述聚类模块,包括扫描器、LDA图片聚类模块及LDA文本聚类模块,所述扫描器连接LDA图片聚类模块。所述标签标注模块,用于对图片库中所有图片标注标签,对歌曲库中所有歌曲的歌词标注标签。所述图片预处理模块,用于对图片库中所有图片进行预处理得到字典,并根据所述字典重构所述图片库中所有图片。所述聚类模块,用于扫描已经重构的图片后,通过LDA得到所述图片的主题,将所述图片对应的标签添加到其自身的主题中,同时通过所述LDA得到歌曲库中歌词的主题,并将所述歌词对应的标签添加到其自身的主题中。所述匹配模块,用于根据图片库中图片的主题得到所述图片的标签,在歌曲库中查找到标签与所述图片的标签相同的歌词。所述播放器,用于播放与所述图片的标签相同的歌词所对应的歌曲。通过本专利技术提供的根据图片自动播放歌曲的方法及系统,首先对图片库中的图片及歌曲库中歌曲的歌词标注标签,然后对图片进行预处理得到字典并重构图片,从而为LDA自动获得图片主题做好铺垫。得到图片主题后,将图片对应的标签添加到其自身的主题中,同时通过LDA得到歌曲库中歌词的主题,并将歌词对应的标签添加到其自身的主题中,最后根据图片库中图片的主题得到其标签,在歌曲库中查找到标签相同的歌词并播放对应歌曲。如此,在发现新的图片时,即可通过本系统自动播放与图片情境相近的音乐,为儿童早教提供了一种便捷的方式。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术较佳实施例提供的根据图片自动播放歌曲的方法流程图;图2是本专利技术较佳实施例提供的根据图片自动播放歌曲的系统示意图。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。图1是本专利技术较佳实施例提供的根据图片自动播放歌曲的方法流程图。如图1所示,本专利技术较佳实施例提供的根据图片自动播放歌曲的方法包括步骤S1至S4。步骤S1:对图片库中所有图片标注标签,对歌曲库中所有歌曲的歌词标注标签。具体而言,图片库中的样本图片是部分经过标注的,所述标签例如树、太阳或草地等。同时,对现有歌曲库中的歌曲进行处理,对歌曲的处理主要根据歌词,而歌词就是文本。所述歌曲也是部分被标注的。于此,对所述图片及歌词分别标注的标签是属于同一个集合。例如树、太阳或草地等。步骤S2:对图片库中所有图片进行预处理得到字典,根据所述字典重构所述图片库中所有图片。具体而言,本实施例中,图片用SIFT(Scale-invariantfeaturetransform,尺度不变特征转换)提取向量特征。预处理的过程为:从图片库中的每张图片里选出N个碎片,每个碎片用SIFT向量表示,从所有的碎片里,用k-means聚类算法得到T个中心点,所述T个中心点构成字典。通常,k-means聚类算法采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。步骤S3:扫描已经重构的图片,通过LDA得到所述图片的主题,将所述图片对应的标签添加到其自身的主题中,同时通过所述LDA得本文档来自技高网
...
一种根据图片自动播放歌曲的方法及系统

【技术保护点】
一种根据图片自动播放歌曲的方法,其特征在于,包括以下步骤:S1、对图片库中所有图片标注标签,对歌曲库中所有歌曲的歌词标注标签;S2、对图片库中所有图片进行预处理得到字典,根据所述字典重构所述图片库中所有图片;S3、扫描已经重构的图片,通过LDA得到所述图片的主题,将所述图片对应的标签添加到其自身的主题中,同时通过所述LDA得到歌曲库中歌词的主题,并将所述歌词对应的标签添加到其自身的主题中;S4、根据图片库中图片的主题得到所述图片的标签,在歌曲库中查找到标签与所述图片的标签相同的歌词,并播放对应歌曲。

【技术特征摘要】
1.一种根据图片自动播放歌曲的方法,其特征在于,包括以下步骤:S1、对图片库中所有图片标注标签,对歌曲库中所有歌曲的歌词标注标签;S2、对图片库中所有图片进行预处理得到字典,根据所述字典重构所述图片库中所有图片;S3、扫描已经重构的图片,通过潜在狄利克雷分配得到所述图片的主题,将所述图片对应的标签添加到其自身的主题中,同时通过所述潜在狄利克雷分配得到歌曲库中歌词的主题,并将所述歌词对应的标签添加到其自身的主题中;S4、根据图片库中图片的主题得到所述图片的标签,在歌曲库中查找到标签与所述图片的标签相同的歌词,并播放对应歌曲。2.根据权利要求1所述的方法,其特征在于,步骤S1中对所述图片及歌词分别标注的标签是属于同一个集合。3.根据权利要求1所述的方法,其特征在于,步骤S2中所述预处理的过程为:从图片库中的每张图片里选出N个碎片,每个碎片用SIFT向量表示,从所有的碎片里,用k-means聚类算法得到T个中心点,所述T个中心点构成字典。4.根据权利要求1所述的方法,其特征在于,在步骤S3中,若图片或歌词没有对应的标签,则将所述图片或歌词主题的标签作为所述图片或歌词的标签。5.根据权利要求1所述的方法,其特征在于,步骤S3中所述图片及...

【专利技术属性】
技术研发人员:严建峰姚婷婷刘志强杨璐李云飞曾嘉
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1