一种监测视频更新的方法和装置制造方法及图纸

技术编号:11707799 阅读:93 留言:0更新日期:2015-07-09 14:32
本发明专利技术提供了一种监测视频更新的方法和装置,以解决现有的监测方案监测效率低、监测结果不准确的问题。其中,方法包括:按照预设周期确定至少一个视频网站中待监测的视频的URL;从URL对应的网页中抓取视频的视频信息;根据视频信息监测视频是否更新;若更新,则获取视频的更新信息,并将视频的视频信息和更新信息保存至数据库中。本发明专利技术能够保证监测结果更加实时、准确,监测效率更高,根据各个视频网站中的视频的更新情况可以分析自身的视频网站中视频更新较慢的原因,从而为视频网站的改进提供有利的依据。

【技术实现步骤摘要】

本专利技术涉及多媒体
,特别是涉及一种监测视频更新的方法和一种监测视频更新的装置。
技术介绍
随着互联网技术和多媒体技术的不断发展,越来越多的视频网站也随之出现。视频网站是指在完善的技术平台支持下,让互联网用户在线流畅发布、浏览和分享视频作品的网络媒体。目前,各个视频网站中的很多视频都是共享版权的,例如对于《武媚娘传奇》这部电视剧来说,爱奇艺、优酷土豆、搜狐视频、腾讯视频、乐视网等视频网站都有播放权,而哪个视频网站中该视频更新的较早,该视频网站在搜索引擎里的排名就会靠前,从而就会有更多用户通过该视频网站观看,进而带来更多的流量。因此,为了提高视频网站的竞争力,各个视频网站都希望能够更早地更新其中的视频。通过对各个视频网站中的视频的更新情况进行监测,可以为自身的视频网站的改进提供依据。目前的监测方法均是通过人为地收集视频网站的后台数据,进而分析视频的更新情况,但是该种方式不仅效率很低,而且监测的结果也不准确。
技术实现思路
本专利技术提供了一种监测视频更新的方法和一种监测视频更新的装置,以解决现有的监测方案监测效率低、监测结果不准确的问题。为了解决上述问题,本专利技术公开了一种监测视频更新的方法,包括:按照预设周期确定至少一个视频网站中待监测的视频的URL ;从所述URL对应的网页中抓取所述视频的视频信息;根据所述视频信息监测所述视频是否更新;若更新,则获取所述视频的更新信息,并将所述视频的视频信息和更新信息保存至数据库中。优选地,所述按照预设周期确定至少一个视频网站中待监测的视频的URL的步骤包括:按照预设周期根据所述数据库中已保存的视频网站中的视频的视频信息和更新信息,从所述数据库中获取至少一个视频网站中待监测的视频的URL ;和/ 或,按照预设周期分别对所述至少一个视频网站的网站信息进行分析,得到所述至少一个视频网站中待监测的视频的URL。优选地,所述视频的视频信息包括视频的URL,所述更新信息包括视频的更新状态;所述根据所述数据库中已保存的视频网站中的视频的视频信息和更新信息,从所述数据库中获取至少一个视频网站中待监测的视频的URL的步骤包括:针对每个已保存的视频网站,分别判断该视频网站中的视频的更新状态;将更新状态为更新未完成的视频的URL确定为该视频网站中待监测的视频的URL0优选地,所述视频网站的网站信息包括:该视频网站的预设频道中的视频的标识和视频的URL,所述分别对所述至少一个视频网站的网站信息进行分析,得到所述至少一个视频网站中待监测的视频的URL的步骤包括:针对每个视频网站,分别判断该视频网站的预设频道中的视频的标识中是否存在新增的标识;如果存在,则将新增的标识对应的视频的URL确定为该视频网站中待监测的视频的 URLo优选地,在所述分别对所述至少一个视频网站的网站信息进行分析,得到所述至少一个视频网站中的待监测视频的URL的步骤之前,还包括:确定所述至少一个视频网站的入口地址;调度爬虫进程访问所述至少一个视频网站的入口地址,获取所述至少一个视频网站的网站信息。优选地,所述从所述URL对应的网页中抓取所述视频的视频信息的步骤包括:将未抓取的网页对应的URL标记为待抓取URL ;调度爬虫进程访问所述待抓取URL,从该待抓取URL对应的网页中抓取所述视频的视频信息,并将已抓取的网页对应的URL标记为已抓取URL ;判断是否存在剩余的待抓取URL,若存在,则返回所述调度爬虫进程访问所述待抓取URL,从该待抓取URL对应的网页中抓取所述视频的视频信息的步骤。优选地,所述获取所述视频的更新信息的步骤包括:记录所述视频的更新时间;判断所述视频是否更新完成,根据判断结果记录所述视频的更新状态;其中,所述更新状态包括更新未完成、更新已完成;将所述视频的更新时间和更新状态作为所述视频的更新信息。为了解决上述问题,本专利技术还公开了一种监测视频更新的装置,包括:确定模块,用于按照预设周期确定至少一个视频网站中待监测的视频的URL ;抓取模块,用于从所述URL对应的网页中抓取所述视频的视频信息;监测模块,用于根据所述视频信息监测所述视频是否更新;保存模块,用于在所述监测模块监测出更新时,获取所述视频的更新信息,并将所述视频的视频信息和更新信息保存至数据库中。优选地,所述确定模块包括:第一确定子模块,用于按照预设周期根据所述数据库中已保存的视频网站中的视频的视频信息和更新信息,从所述数据库中获取至少一个视频网站中待监测的视频的URL ;和/ 或,第二确定子模块,用于按照预设周期分别对所述至少一个视频网站的网站信息进行分析,得到所述至少一个视频网站中待监测的视频的URL。优选地,所述视频的视频信息包括视频的URL,所述更新信息包括视频的更新状态;所述第一确定子模块包括:状态判断子单元,用于针对每个已保存的视频网站,分别判断该视频网站中的视频的更新状态;状态确定子单元,用于将更新状态为更新未完成的视频的URL确定为该视频网站中待监测的视频的URL。优选地,所述视频网站的网站信息包括:该视频网站的预设频道中的视频的标识和视频的URL,所述第二确定子模块包括:标识判断子单元,用于针对每个视频网站,分别判断该视频网站的预设频道中的视频的标识中是否存在新增的标识;标识确定子单元,用于在所述标识判断子单元判断出存在时,将新增的标识对应的视频的URL确定为该视频网站中待监测的视频的URL。 优选地,所述确定模块还包括:信息获取子模块,用于在所述第二确定子模块分别对所述至少一个视频网站的网站信息进行分析之前,确定所述至少一个视频网站的入口地址,以及调度爬虫进程访问所述至少一个视频网站的入口地址,获取所述至少一个视频网站的网站信息。优选地,所述抓取模块包括:URL标记子模块,用于将未抓取的网页对应的URL标记为待抓取URL ;URL抓取子模块,用于调度爬虫进程访问所述待抓取URL,从该待抓取URL对应的网页中抓取所述视频的视频信息,并将已抓取的网页对应的URL标记为已抓取URL ;URL判断子模块,用于判断是否存在剩余的待抓取URL,若存在,则调用所述抓取子模块。优选地,所述保存模块包括:时间记录子模块,用于记录所述视频的更新时间;状态记录子模块,用于判断所述视频是否更新完成,根据判断结果记录所述视频的更新状态;其中,所述更新状态包括更新未完成、更新已完成;将所述视频的更新时间和更新状态作为所述视频的更新信息。与现有技术相比,本专利技术包括以下优点:本专利技术中按照预设周期确定至少一个视频网站中的待监测的视频的URL(UniformResource Locator,统一资源定位符),然后从这些URL对应的网页中抓取对应视频的视频信息,并根据视频信息监测该视频是否更新,若更新,则获取该视频的更新信息,并将该视频的视频信息和更新信息保存至数据库中。通过上述方式可以自动监测各个视频网站中的视频的更新情况,并且通过对各个视频网站的前台网页中的数据进行监测,能够保证监测结果更加实时、准确,监测效率更高,根据各个视频网站中的视频的更新情况可以分析自身的视频网站中视频更新较慢的原因,从而为视频网站的改进提供有利的依据。【附图说明】图1是本专利技术实施例一的一种监测视频更新的方法的步骤流程图;图2是本专利技术实施例二的一种监测视频更新的方法的本文档来自技高网...

【技术保护点】
一种监测视频更新的方法,其特征在于,包括:按照预设周期确定至少一个视频网站中待监测的视频的URL;从所述URL对应的网页中抓取所述视频的视频信息;根据所述视频信息监测所述视频是否更新;若更新,则获取所述视频的更新信息,并将所述视频的视频信息和更新信息保存至数据库中。

【技术特征摘要】

【专利技术属性】
技术研发人员:林祖新
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1