构建乐谱库的方法和装置制造方法及图纸

技术编号:15294499 阅读:92 留言:0更新日期:2017-05-11 11:20
本发明专利技术公开了一种构建乐谱库的方法和装置,属于网络通信技术领域。方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。装置包括:第一爬取模块,第二爬取模块,第一获取模块,验证模块和第一添加模块。本发明专利技术通过验证乐谱与多媒体文件是否匹配,将匹配的乐谱和多媒体文件的标识的对应关系添加到乐谱库中,提高了多媒体服务器构建乐谱库的准确性。

Method and apparatus for constructing Music Library

The invention discloses a method and a device for constructing a music score library, which belongs to the technical field of network communication. The method includes: crawling music, as well as from the target site, the climbing multimedia file corresponding to the score from the target site identification; according to the multimedia file identification, access the multimedia file; according to the music and the multimedia file, verify the music and the multimedia file whether the match; if the music and the multimedia file, and add the corresponding relation between the music and the multimedia file identification to music in the library. The device comprises a first crawling module, a second climbing module, a first acquisition module, a verification module and a first adding module. The present invention through the verification of music and multimedia files, add the corresponding relationship between the matching scores and the identification of the multimedia file to the music library, improve the accuracy of the multimedia server construction template.

【技术实现步骤摘要】

本专利技术涉及网络通信
,特别涉及一种构建乐谱库的方法和装置
技术介绍
随着网络通信技术的发展,多媒体服务器的功能越来越强大;多媒体服务器向终端从发送歌曲时,不仅可以向终端发送歌曲,还能够向终端发送歌曲的乐谱,以使终端在播放歌曲的同时,在当前播放界面上显示歌曲的乐谱。因此,多媒体服务器向终端发送歌曲的乐谱之前,需要构建乐谱库。目前,多媒体服务器在构建乐谱库时,多媒体服务器先获取提供乐谱的目标网站的网址,根据该目标网站的网址,从目标网站中爬取包含乐谱的图像。该图像中往往包含该乐谱的歌曲的名称;然后人工从该图像中识别出该乐谱的歌曲的名称。多媒体服务器将该歌曲的名称和包含该乐谱的图像对应关系添加到乐谱库中。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:由于目标网站中包含乐谱的图像往往为用户上传的,该图像中可能包含错误的乐谱,从而导致多媒体服务器构建乐谱库中包含错误的乐谱,也即上述方法构建乐谱库的准确性差。
技术实现思路
为了解决现有技术的问题,本专利技术提供了一种构建乐谱库的方法和装置。技术方案如下:第一方面,本专利技术实施例提供了一种构建乐谱库的方法,所述方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。可选的,所述根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配,包括:根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度;如果所述相似度超过预设阈值,确定所述乐谱与所述多媒体文件匹配。可选的,所述根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度之前,所述方法还包括:获取预设数目个样本乐谱、每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度;根据所述每个样本乐谱、所述每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度,通过迭代算法,对所述预设相似度算法进行优化。可选的,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之前,所述方法还包括:将指定标注信息添加到所述乐谱中,所述指定标注信息用于标注多媒体服务器。可选的,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之后,所述方法还包括:接收终端发送的反馈信息,所述反馈信息中包括所述乐谱中待校正的音符标识和校正后的音符;根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符。可选的,所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符之前,所述方法还包括:统计接收所述反馈信息的接收次数;如果所述接收次数超过预设次数,执行所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符的步骤。可选的,所述从目标网站中爬取乐谱,包括:获取所述目标网站的标识,根据所述目标网站的标识,获取所述目标网站中乐谱所在的位置信息;根据所述目标网站的标识和所述位置信息,在所述目标网站中确定所述位置信息对应的爬取区域;从所述爬取区域中爬取所述乐谱。可选的,所述从所述爬取区域中爬取所述乐谱,包括:从所述爬取区域中爬取包含所述乐谱的图像;从所述图像中识别出所述乐谱的音符序列和节拍标识,将所述音符序列和所述节拍标识组成所述乐谱。可选的,所述从所述目标网站中爬取所述乐谱对应的多媒体文件的标识,包括:从所述目标网站中爬取文字信息,从所述文字信息中提取所述乐谱对应的多媒体文件的标识。可选的,如果从所述目标网站中没有爬取到所述多媒体文件的标识,所述方法还包括:根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件;将所述乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。可选的,所述根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件,包括:获取所述多媒体文件库中的每个多媒体文件;根据所述乐谱和所述每个多媒体文件,通过预设相似度算法,确定所述乐谱与所述每个多媒体文件之间的相似度;根据所述乐谱与所述每个多媒体文件之间的相似度,从所述多媒体文件库中选择相似度满足预设条件的多媒体文件;将选择的多媒体文件确定为与所述乐谱匹配的多媒体文件。第二方面,本专利技术实施例提供了一种构建乐谱库的装置,所述装置包括:第一爬取模块,用于从目标网站中爬取乐谱;第二爬取模块,用于从所述目标网站中爬取所述乐谱对应的多媒体文件的标识。第一获取模块,用于根据所述多媒体文件的标识,获取所述多媒体文件。验证模块,用于根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配。第一添加模块,用于如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。可选的,所述验证模块,包括:第一确定单元,用于根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度;第二确定单元,用于如果所述相似度超过预设阈值,确定所述乐谱与所述多媒体文件匹配。可选的,所述装置还包括:第二获取模块,用于获取预设数目个样本乐谱、每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度;优化模块,用于根据所述每个样本乐谱、所述每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度,通过迭代算法,对所述预设相似度算法进行优化。可选的,所述装置还包括:第二添加模块,用于将指定标注信息添加到所述乐谱中,所述指定标注信息用于标注多媒体服务器。可选的,所述装置还包括:接收模块,用于接收终端发送的反馈信息,所述反馈信息中包括所述乐谱中待校正的音符标识和校正后的音符;修改模块,用于根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符。可选的,所述装置还包括:统计模块,用于统计接收所述反馈信息的接收次数;所述修改模块,还用于如果所述接收次数超过预设次数,执行所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符。可选的,所述第一爬取模块,包括:第一获取单元,用于获取所述目标网站的标识,根据所述目标网站的标识,获取所述目标网站中乐谱所在的位置信息;第三确定单元,用于根据所述目标网站的标识和所述位置信息,在所述目标网站中确定所述位置信息对应的爬取区域;爬取单元,用于从所述爬取区域中爬取所述乐谱。可选的,所述爬取单元,还用于从所述爬取区域中爬取包含所述乐谱的图像;从所述图像中识别出所述乐谱的音符序列和节拍标识,将所述音符序列和所述节拍标识组成所述乐谱。可选的,所述第二爬取模块,还用于从所述目标网站中爬取文字信息,从所述文字信息中提取所述乐谱对应的多媒体文件的标识。可选的,如果从所述目标网站中没有爬取到所述多媒体文件的标识,所述装置还包括:选择模块,用于根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件;第三添加模块,用于将所述乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。可选的,所述选择模块,包括:第二获取单元,用于获取所述多媒体文件库中的本文档来自技高网...
构建乐谱库的方法和装置

【技术保护点】
一种构建乐谱库的方法,其特征在于,所述方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。

【技术特征摘要】
1.一种构建乐谱库的方法,其特征在于,所述方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。2.根据权利要求1所述的方法,其特征在于,所述根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配,包括:根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度;如果所述相似度超过预设阈值,确定所述乐谱与所述多媒体文件匹配。3.根据权利要求2所述的方法,其特征在于,所述根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度之前,所述方法还包括:获取预设数目的样本乐谱、每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度;根据所述每个样本乐谱、所述每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度,通过迭代算法,对所述预设相似度算法进行优化。4.根据权利要求1所述的方法,其特征在于,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之前,所述方法还包括:将指定标注信息添加到所述乐谱中,所述指定标注信息用于标注多媒体服务器。5.根据权利要求1所述的方法,其特征在于,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之后,所述方法还包括:接收终端发送的反馈信息,所述反馈信息中包括所述乐谱中待校正的音符标识和校正后的音符;根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符。6.根据权利要求5所述的方法,其特征在于,所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符之前,所述方法还包括:统计接收所述反馈信息的接收次数;如果所述接收次数超过预设次数,执行所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符的步骤。7.根据权利要求1所述的方法,其特征在于,所述从目标网站中爬取乐谱,包括:获取所述目标网站的标识,根据所述目标网站的标识,获取所述目标网站中乐谱所在的位置信息;根据所述目标网站的标识和所述位置信息,在所述目标网站中确定所述位置信息对应的爬取区域;从所述爬取区域中爬取所述乐谱。8.根据权利要求7所述的方法,其特征在于,所述从所述爬取区域中爬取所述乐谱,包括:从所述爬取区域中爬取包含所述乐谱的图像;从所述图像中识别出所述乐谱的音符序列和节拍标识,将所述音符序列和所述节拍标识组成所述乐谱。9.根据权利要求1所述的方法,其特征在于,所述从所述目标网站中爬取所述乐谱对应的多媒体文件的标识,包括:从所述目标网站中的指定区域爬取文字信息,从所述文字信息中提取所述乐谱对应的多媒体文件的标识。10.根据权利要求1所述的方法,其特征在于,如果从所述目标网站中没有爬取到所述多媒体文件的标识,所述方法还包括:根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件;将所述乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。11.根据权利要求10所述的方法,其特征在于,所述根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件,包括:获取所述多媒体文件库中的每个多媒体文件;根据所述乐谱和所述每个多媒体文件,通过预设相似度算法,确定所述乐谱与所述每个多媒体文件之间的相似度;根据所述乐谱与所述每个多媒体文件之间的相似度,从所述多媒体文件库中选择相似度满足预设条件的多媒体文件;将选择的多媒体...

【专利技术属性】
技术研发人员:刘卓
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1