【技术实现步骤摘要】
本专利技术涉及一种基于直方图的网络视频缩略图提取及映射方法
技术介绍
目前网络爬虫只爬取文本,不能爬取音乐、图片和视频等多媒体文件,原因主要是多媒体数据量巨大;如何下载传输多媒体文件;如何索引多媒体文件;进而对处理过的多媒体文件进行检索。现在因特网上有大量的多媒体文件,特别是社交网站和多媒体分享的兴起,需要对多媒体文件进行精准检索。网络爬虫,也称网络蜘蛛、网络机器人,是一个自动提取网页的程序,它从因特网上下载网页,是搜索引擎的重要组成部分。网络爬虫利用标准的HTTP协议,根据超级链接和Web文档检索的方法遍历因特网信息空间。因特网上有数千种不同的数据类型,HTTP给每种要通过Web传输的对象都打上了名为MIME类型的数据格式标签(常见视频格式:video/MP4V-ES,video/mpeg,video/quicktime,video/vnd.mpegurl,video/x-msvideo)(常见图片格式:image/jpeg,image/gif)。统一资源定位符(URL)是资源标识符最常见的形式。URL描述了一台特定服务器上某资源的特定位置。元素文件(METAFILE)可提供有关页面的元信息,如针对搜索引擎和更新频度的描述和关键词,可针对元素的关键词进行索引。UDP是OSI参考模型中一种无连接的传输层协议,它主要用于不要求分组顺序到达的传输中,分组传输顺序的检查与排序由应用层完成,提供面向事务的简单不可靠信息传送服务。网络图片可通过UDP进行下载,因为UDP具有TCP所望尘莫及的速度优势。基于关键帧的网络视频格式文件摘要提取,计算量非常大,实时要求很难 ...
【技术保护点】
一种基于直方图的网络视频缩略图提取及映射方法,其具体步骤如下:1)通过URL确定网络视频缩略图的地址;2)利用UDP协议缓存下载网络视频缩略图;3)提取网络视频缩略图的颜色和灰阶直方图,并建立与URL的映射;4)然后存储到服务器集成数据中心;5)以便对网络视频缩略图,进行关键词基础上的精准检索。
【技术特征摘要】
1.一种基于直方图的网络视频缩略图提取及映射方法,其具体步骤如下:1)通过URL确定网络视频缩略图的地址;2)利用UDP协议缓存下载网络视频缩略图;3...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。