一种多媒体文件搜索方法及装置制造方法及图纸

技术编号:9718829 阅读:128 留言:0更新日期:2014-02-27 05:36
本发明专利技术提供一种多媒体文件搜索方法及装置,涉及互联网多媒体领域,能够扩大用户搜索的范围,提高搜索匹配率,降低搜索开销。该方法包括,预先建立一全网数据库,所述全网数据库至少包括自身网站具有播放版权的多媒体文件资源、对外合作网站的多媒体文件资源以及通过爬虫技术从各个外部网站抓取多媒体文件资源,多媒体搜索装置接收来自电子设备的多媒体文件搜索信息,并根据所述多媒体文件搜索信息,从所述全网数据库中获取与所述多媒体文件搜索信息匹配的多媒体文件资源,然后,向所述电子设备发送所述多媒体文件资源。

【技术实现步骤摘要】
一种多媒体文件搜索方法及装置
本专利技术涉及互联网多媒体领域,尤其涉及一种多媒体文件搜索方法及装置。
技术介绍
随着网路技术和视频技术的发展,用户对视频搜索的功能有了更高的要求,以前,对于很多视频用户,站内搜索足以满足其需求,因为其它网站有的,自己使用的网站也会有,在这种情况下,用户仅仅在有限的一或两家视频网站就可以满足搜索需求。但是,随着视频网站“版权化”的日益正规和深入,用户对全网视频搜索的需求越来越迫切。在视频版权的约束下,各家的视频内容将出现“异质化”,由于各视频网站的建设方向不同,电影、电视等内容也各有所长,使得各视频网站的内容不可避免地出现差异。在各视频网站逐渐“异质化”的情况下,用户的搜索匹配率低,用户经常需要在多家网站之间进行切换,进行多次搜索,才能得到符合的搜索结果,使得用户搜索开销大。
技术实现思路
本专利技术提供一种多媒体文件搜索方法及装置,能够扩大用户搜索的范围,提高搜索匹配率,降低搜索开销。为达到上述目的,本专利技术的实施例采用如下技术方案:本专利技术提供一种多媒体文件搜索方法,预先建立一全网数据库,所述全网数据库至少包括自身网站具有播放版权的多媒体本文档来自技高网...

【技术保护点】
一种多媒体文件搜索方法,其特征在于,预先建立一全网数据库,所述全网数据库至少包括自身网站具有播放版权的多媒体文件资源、对外合作网站的多媒体文件资源以及通过爬虫技术从各个外部网站抓取的多媒体文件资源,所述方法包括:接收来自电子设备的多媒体文件搜索信息;根据所述多媒体文件搜索信息,从所述全网数据库中获取与所述多媒体文件搜索信息匹配的多媒体文件资源;向所述电子设备发送所述多媒体文件资源。

【技术特征摘要】
1.一种多媒体文件搜索方法,其特征在于,预先建立一全网数据库,所述全网数据库至少包括自身网站具有播放版权的多媒体文件资源、对外合作网站的多媒体文件资源以及通过爬虫技术从各个外部网站抓取的多媒体文件资源,所述方法包括:接收来自电子设备的多媒体文件搜索信息;根据所述多媒体文件搜索信息,从所述全网数据库中获取与所述多媒体文件搜索信息匹配的多媒体文件资源;向所述电子设备发送所述多媒体文件资源。2.根据权利要求1所述的方法,其特征在于, 所述自身网站具有播放版权的多媒体文件资源包括用户上传的多媒体文件资源,以及已购买播放版权的多媒体文件资源;所述对外合作网站的多媒体文件资源包括自身网站与外部网站合作的所述外部网站的多媒体文件资源,所述对外合作网站的多媒体文件资源是通过网址链接到所述对外合作网站的多媒体文件资源上来实现的。3.根据权利要求1或2所述的方法,其特征在于,所述通过爬虫技术从各个外部网站抓取的多媒体文件资源的抓取步骤包括:根据网页分析算法从所述各个外部网站过滤与多媒体文件无关的链接,并将与所述多媒体文件相关联的链接放入等待抓取的统一资源定位符URL队列;获取至少一个初始抓取URL,根据预设抓取方法从初始抓取URL开始对所述URL队列中的URL进行分析,选择要抓取的网页的URL,直到到达预设条件时停止;将所述被抓取的URL对应的网页在系统中存储。4.根据权利要求3所述的方法,其特征在于,所述网页分析算法包括基于网络拓扑的分析算法、基于网页内容的分析算法、基于用户访问的分析算法。5.根据权利要求3或4所述的方法,其特征在于,所述预设抓取方法包括深度优先抓取方法、广度优先抓取方法、最佳优先抓取方法。6....

【专利技术属性】
技术研发人员:曹坤波郑磊
申请(专利权)人:乐视网信息技术北京股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1