【技术实现步骤摘要】
一种基于浏览器的视频获取方法及系统
本专利技术属于互联网
,特别涉及一种基于浏览器的视频获取方法及系统。
技术介绍
近年来随着计算机技术、网络技术和多媒体技术的飞速发展,媒体获取、传输和发布方式发生了巨大的变革,云计算、多媒体都得到了广泛的应用。越来越多用户已经可以方便地实现网络视频通信,订阅和播放网络上的多媒体数据。这些应用使得对网络多媒体的安全监控成为必然。多媒体安全涵盖了政治、经济、技术、文化、人身等多个层面。由于多媒体内容信息安全所占据的主导地位,在很大程度上其他的安全形态都由它延伸出来。但多媒体网络节点分散、强动态变化等特性使得其不易管理和安全性较差,因此,开展违规视频检测与分析将具有重要的意义。在对互联网中的视频进行检测前,需要对互联网中的视频数据进行获取。由于互联网中存在巨量的网络地址数据,其中包含着大量的视频网络地址数据,其对应的视频数据量大、类型多,并且不同网站的实现技术也不同。部分不同视频网络地址数据,还对应着相同的视频数据。多数网站已经应用反爬虫系统。因此,大批量自动下载互联网中的视频数据 ...
【技术保护点】
1.一种基于浏览器的视频获取方法,其特征在于,所述视频获取方法包括:/n获得非视频网络地址数据;/n根据所述非视频网络地址数据,使用浏览器自动化测试方法抓取网络页面中的视频网络地址数据;/n根据所述视频网络地址数据下载视频数据、保存视频数据。/n
【技术特征摘要】
1.一种基于浏览器的视频获取方法,其特征在于,所述视频获取方法包括:
获得非视频网络地址数据;
根据所述非视频网络地址数据,使用浏览器自动化测试方法抓取网络页面中的视频网络地址数据;
根据所述视频网络地址数据下载视频数据、保存视频数据。
2.根据权利要求1所述的视频获取方法,其特征在于,所述下载视频数据包括:
对所述视频网络地址数据进行IO流处理;
通过所述IO流,下载网页中的视频数据。
3.根据权利要求1所述的视频获取方法,其特征在于,
所述使用浏览器自动化测试方法抓取包括:
调用ChromeOptions设置渲染方式;
调用ChromeDriver加载浏览器,获取视频网络地址。
4.根据权利要求3所述的视频获取方法,其特征在于,所述抓取网络页面中的视频网络地址数据还包括:
抓取所述网络页面中视频网络地址数据,抓取所述网络页面的链接网络页面中的视频网络地址数据。
5.根据权利要求1所述的视频获取方法,其特征在于,所述下载视频数据还包括:
对下载的视频进行去重复视频操作。
6.根据权利要求1所述的视频获取方法,其特征在于,
若抓取所述网络页面中的视频网络地址数据失败,则自动重新抓取;
自动重新抓取次数超过重爬阈值,则停止抓取;
将所述网络页面对应的网络地址数据保存至数据库服务器中,等待再次被调取执行。
...
【专利技术属性】
技术研发人员:夏光升,孙涛,
申请(专利权)人:天津市国瑞数码安全系统股份有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。