一种音乐资源聚合搜索的方法技术

技术编号:12778829 阅读:217 留言:0更新日期:2016-01-27 21:04
本发明专利技术公开了一种音乐资源聚合搜索的方法,具体步骤如下:将互联网中的音乐信息进行爬取;在爬取过程中进行URL过滤、中文分词处理,并分别对互联网中的音乐信息及本地库的音乐资源建立全文索引;在检索时以改进后BM25算法进行聚合搜索,将互联网中的音乐资源与本地库中的音乐资源聚合后呈现给用户。本发明专利技术能够针对音乐搜索类的用户这一特定搜索群体,将互联网上的音乐方面的相关信息以及本地媒体数据库的资源进行聚合,对搜索结果进行排序优化、冗余信息过滤和对关键字进行中文分词处理,以一种更加专业、更加全面、更加清晰、更加优化的搜索结果呈献给用户,能够极大地提高音乐搜索类这一特定类型用户搜索结果的专业性、查准率以及满意度。

【技术实现步骤摘要】

本专利技术设及计算机信息检索领域,具体是一种音乐资源聚合捜索的方法。
技术介绍
传统捜索引擎的技术虽然在日趋完善,并作为一个强大的功能模块也被应用在了 多种类型的网站中,如音乐网站的检索功能等,但由于用户的需求的不断发展和细化,传统 的捜索引擎不足W满足特定用户群体,如音乐信息捜索类用户的捜索需求,因此在音乐信 息采集和捜索运一特定领域,传统捜索引擎凸显出了许多不足之处: (1)传统的捜索引擎由于只是单方面的从互联网上爬取信息,所有信息均来自于 互联网;而主流的音乐网站对音乐的检索资源均来自于网站本地数据库的资源,不包含任 何互联网的信息,包含信息量相对较少,而且信息更新速度较低。二者均未实现对于音乐资 源的聚合式捜索,即本地媒体资源与互联网信息的聚合捜索,导致捜索的信息浅表片面,无 法同时满足音乐用户对于信息的专业性和实时性的需求。 (2)在用户需求特性方面,捜索引擎的用户群体基数较大,个体之间的需求层次差 异也比较明显,因此对于捜索结果的侧重点也不尽相同。比如,一个艺人既是音乐人又是作 家,用户想要侧重捜索运个艺人作为音乐人身份的相关信息,但传统捜索引擎的捜索结果 本文档来自技高网...

【技术保护点】
一种音乐资源聚合搜索的方法,其特征在于,具体步骤如下:(1)将互联网中的音乐信息进行爬取;(2)在爬取过程中进行URL过滤、中文分词处理,并分别对互联网中的音乐信息及本地库的音乐资源建立全文索引;(3)在检索时以改进后BM25算法进行聚合搜索,将互联网中的音乐资源与本地库中的音乐资源聚合后呈现给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:李建飞李樱沙飞吕志胜王永滨
申请(专利权)人:中国传媒大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1