【技术实现步骤摘要】
本专利技术涉及一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法
技术介绍
目前网络爬虫只爬取文本,不能爬取音乐、图片和视频等多媒体文件,原因主要是多媒体数据量巨大;如何下载传输多媒体文件;如何索引多媒体文件;进而对处理过的多媒体文件进行检索。现在因特网上有大量的多媒体文件,特别是社交网站和多媒体分享的兴起,需要对多媒体文件进行精准检索。网络爬虫,也称网络蜘蛛、网络机器人,是一个自动提取网页的程序,它从因特网上下载网页,是搜索引擎的重要组成部分。网络爬虫利用标准的HTTP协议,根据超级链接和Web文档检索的方法遍历因特网信息空间。因特网上有数千种不同的数据类型,HTTP给每种要通过Web传输的对象都打上了名为MIME类型的数据格式标签(常见视频格式:video/MP4V-ES,video/mpeg,video/quicktime,video/vnd.mpegurl,video/x-msvideo)。统一资源定位符(URL)是资源标识符最常见的形式。URL描述了一台特定服务器上某资源的特定位置。UDP是OSI参考模型中一种无连接的传输层协议,它主要用于不要求分组顺序到达的传输中,分组传输顺序的检查与排序由应用层完成,提供面向事务的简单不可靠信息传送服务。网络视频可通过UDP进行下载,因为UDP具有TCP所望尘莫及的速度优势。本专利技术提供了一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法,可在适当增加数据量的前提下,通过URL确定网络视频格式文件的地址,利用UDP协议缓存下载网络视频格式文件,将视频序列切分为若干镜头,然后根据颜色直方图从镜头 ...
【技术保护点】
一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法,其具体步骤如下:1)通过URL确定网络视频格式文件的地址;2)利用UDP协议缓存下载网络视频格式文件;3)将视频序列切分为若干镜头,再从每个镜头中按均匀时间间隔提取3个关键帧;4)基于关键帧之间的差异计算镜头之间的距离矩阵,然后采用层次汇合聚类算法HAC,对镜头进行层次聚类;5)从每个聚合类中选出时间最长的镜头,将摘要的总时间长度按比例分配给每个选出的镜头,根据分配的时间长度,根据颜色直方图对关键帧打分,从每个选出的镜头中找出一个重要连续片段;6)最终的摘要就是将这些片段按时间顺序进行串接所形成的视频序列。
【技术特征摘要】
1.一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法,其具体步骤如下:1)通过URL确定网络视频格式文件的地址;2)利用UDP协议缓存下载网络视频格式文件;3)将视频序列切分为若干镜头,再从每个镜头中按均匀时间间隔提取3个关键帧;4)基于关键帧之间的差异计算镜头之间的距离矩阵,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。