一种移动视频直播/监控视频采集源特征分类方法技术

技术编号:18459044 阅读:24 留言:0更新日期:2018-07-18 12:48
本发明专利技术所公开的是一种移动视频直播/监控视频采集源特征分类方法,所述方法包括,S1:基于对所有预分类视频的描述信息建立词频向量,建立每个视频的词频向量;S2:根据视频的词频向量,采用余弦相似度计算每个视频与其它视频的相似度,根据相似度的大小对所有视频分成若干类。本发明专利技术提出的视频源特征分类方法,结合视频图像外的一些参数,包括关键词、地理位置等关键因素,计算移动视频采集源采集内容的相似程度,进而分成若干的类,每一种类可代表一个独立的事件,可以达到更细致、准确对视频源进行分类。

A feature classification method for mobile video live / surveillance video collection sources

The present invention discloses a feature classification method of video live / monitor video acquisition source. The method includes: S1: building word frequency vector based on description information of all pre classified video and establishing word frequency vector of each video; S2: according to the word frequency vector of video, each video is calculated by cosine similarity. The similarity of video is divided into several classes according to the similarity. The video source feature classification method proposed by this invention is combined with some key factors, such as key factors, such as key words and geographical location, to calculate the similarity degree of the collection content of the mobile video acquisition source, and then divide into several classes. Each kind can represent an independent event and can be more detailed and accurate. Video sources are classified.

【技术实现步骤摘要】
一种移动视频直播/监控视频采集源特征分类方法
本专利技术所涉及的
是对视频进行分类的方法,具体为一种移动视频采集源特征分类方法。技术背景随着移动手机终端的普及以及4G网络的全面覆盖,视频移动直播、视频移动监控等新媒体互联网应用被广泛应用于人们的生产、生活中。在这种应用中,手机可作为视频采集的源,接入后端的流媒体服务节点,向公众用户发布视频图像信息。移动直播/监控视频采集源由于其随机性会带来内容意义的不断变化,但其中很多源的内容往往指向相同的社会事件。公告号为CN107180074A的专利在2017年3月31号公开了一种视频分类方法及装置,所述方法包括:获取视频文件;提取所述视频文件中各个镜头的关键帧,得到多个视频帧;针对每个视频帧,确定该视频帧的类别;统计所有视频帧的类别和每个视频帧的时长;根据统计结果,将所述视频文件进行分类。通过本专利技术实施例提供的视频分类方法及装置,可以实现及时对网站上的视频进行分类,提高用户体验,节约了人力。在现有技术中,采用关键帧图像处理,去判断视频是否属于同一事件,仍存在不足。因为针对同一事件,同一场景,但拍摄者所处的拍摄角度不同,最终呈现的视频影像也会不同,就会造成关键帧的不同,从而导致属于播放同一事件的视频划分到不同的类别中,对视频做出错误的分类。
技术实现思路
本专利技术的目的是为了解决上述问题中,存在的不足,提供一种移动视频直播/监控视频采集源特征分类方法,能更好地解决视频分类的方法,每一类可代表一个独立的事件。本专利技术所采用的技术方案是提供一种移动视频直播/监控视频采集源特征分类方法,所述方法包括,S1:基于对所有预分类视频的描述信息建立词频向量,建立每个视频的词频向量;S2:根据视频的词频向量,采用余弦相似度计算每个视频与其他视频的相似度,根据相似度的大小对所有视频分成若干类。优选地,所述词频向量是由0和1组成的多元向量。优选地,所述计算每个视频与其他视频的相似度具体为:选取任意一个视频的词频向量组,采用余弦相似度算法计算所选的视频其与其它视频的词频向量组彼此间的相似度,根据相似度的大小进行归类,在剩余的词频向量组中重新选择一个新的词频向量组,重复计算步骤,直到所有的词频向量组被选完,将所有的视频分为若干类。优选地,所述计算所选的视频其与其它视频的词频向量组彼此间的相似度,将相似度大于阈值0.7的视频与所选视频组成归为一类。优选地,所述的每个视频对应一个地理位置数据,基于视频的地理位置数据对视频进一步划分。优选地,所述进一步划分的步骤包括:若干类中的任一分类中,任选一个视频,根据地理位置数据,将该视频与同类中跟所选视频地理位置上相距不超过一定距离的视频组成一个新的集合,在该集合中另选一个视频,根据地理位置数据,将该类中与所选视频地理位置上相距不超过一定距离的视频合并到新的集合中,直至集合中的视频全部被选完。优选地,所述的一定距离为600-1200米。本专利技术与现有技术相比较,具有的有益效果为:1.采用本专利技术的技术方案,可以实现对移动视频采集源进行分类处理,帮助用户进行大数据挖掘分析,热点事件跟踪以及系统资源划级分配等工作。2.本专利技术提出的视频源特征分类方法,结合视频图像外的一些参数,包括关键词、地理位置等关键因素,计算移动视频采集源采集内容的相似程度,进而分成若干的类,每一种类可代表一个独立的事件,可以达到更细致、准确对视频源进行分类。附图说明图1为本专利技术的流程图。图2为本专利技术视频源分类划分的示意过程。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下将结合附图和实施例,对本专利技术作进一步详细说明。首先,基于视频的描述信息建立词频向量。一般移动视频源由发起方建立时会提供若干关键词作为标签用于对该监控事件的描述,或者会用简单摘要(可拆分为单词)描述直播或监控的相关内容,这些内容可作为挖掘直播/监控等视频的社会意义的重要依据,本方法通过关键单词出现频率建立表征视频的向量组。S1:具体步骤如下:1)设定已存在在线服务的视频源集合V={V1,V2,……,Vm}2)设定每一个视频Vi对应一个关键词组为Pi={Pi1,Pi2,……Pij},每个集合Pi所包含的词数量可不相同。3)取A=P1∪P2∪P3……∪Pm,则集合A包括了所有视频源的非重复独立关键词元素,数量设定为h,A={A1,A2,A3,……,Ah}4)设定Ai为视频Vi对应的一个词频向量,Ai={Ai1,Ai2,Ai3,……,Aih}其中向量Aix∈Ai,则其向量取值计算方法为:如果Ax∈Pi的,则Aix=1;如果Ax∉Pi,则Aix=0;因此,可得到视频的词频向量Ai,Ai由0和1组成的一个多元向量。为了便于理解,具体例子如下,同一时间两个视频源:视频源1,其关键词为:琶洲国际展馆、A区、食博会、主席台路演视频源2,其关键词为:琶洲国际展馆、B区、安博会、机器人制造展区则向量分词组为A={琶洲国际展馆,A区,B区,食博会,安博会,主席台路演,机器人制造展区},则对应视频源1的词频向量值A1={1,1,0,1,0,1,0}对应视频源2的词频向量值A2={1,0,1,0,1,0,1}S2具体步骤:基于S1步骤得到的每个视频的词频向量,采用余弦相似度算法计算视频源的相似特性,将其分为若干类。余弦相似度算法是根据向量空间的夹角大小来衡量两组多维向量相似的概率的一种有效方法。根据余弦定理求出两组向量余弦值的,余弦值越接近于1,则夹角越小,相似程度越高,余弦值越接近于0,则夹角越大,相似程度越低。当夹角为0时则可认为两组向量重合,两者完全相似,当夹角为90度时,则向量方向成直角,则可认为两者完全不相似。5)从A1,A2,A3,……,Am随机选择一个向量组Aj,计算其与其他向量组彼此间的相似度,计算方法如下:如Aj和另外一个向量Ay间的相似度:6)选择与Aj相似度大于阈值0.7的视频源,与Aj组成新的一类,认为此类中的视频源内容比较相近,大概率属于监控同一个事件。7)在剩余的向量组中重新选择一个向量组,重复步骤(5),直到所有的向量组被选完。8)最终得到一个分类结果,Q={Q1,Q2……Qw},包含了V中的所有视频源,Q1,Q2……Qw,分别代表不同的类别。S3具体步骤:基于视频采集源的地理位置信息对S2步骤得到的类进一步划分。现实场景中很多活动名称含义是很相似,但还并不能完全确定针对同一事件,因此还需要借助于其他的因素提高对分类的判断精度。因此对于S2步骤得到的类中超过子元素大于1的类,可基于视频源上传地点的地理位置信息对S2步骤产生的类进行进一步分类,将彼此间距离较近的点再划分为一类,为最终结果。9)设V中所有的视频源对应一个当前的地理位置数据(可以由手机终端定时采集并且上传,以经纬度方式描述)G={G1,G2,……Gm},则某一个分类Qx中会包含有若干的G元素。10)在Q中选择一个分类Qx,计算Qx中任意源节点间的直线距离,节点间的距离可标识为Dij;11)在Qx中任意选择一个源Gi,同时选出在Qx中所有与Gi距离D不超过阈值,阈值为1000米的所有点,与Gi组合成新的类Qy,此时Gi可标记为Selected;在Qy中再选出一个未标识为Selected的点Gj,同时选出在Qx中所有与Gj距离D不超过阈本文档来自技高网...

【技术保护点】
1.一种移动视频直播/监控视频采集源特征分类方法,其特征在于:所述方法包括,S1:基于对所有预分类视频的描述信息建立词频向量,建立每个视频的词频向量;S2:根据视频的词频向量,采用余弦相似度计算每个视频与其它视频的相似度,根据相似度的大小对所有视频分成若干类。

【技术特征摘要】
1.一种移动视频直播/监控视频采集源特征分类方法,其特征在于:所述方法包括,S1:基于对所有预分类视频的描述信息建立词频向量,建立每个视频的词频向量;S2:根据视频的词频向量,采用余弦相似度计算每个视频与其它视频的相似度,根据相似度的大小对所有视频分成若干类。2.根据权利要求1所述的移动视频直播/监控视频采集源特征分类方法,其特征在于:上述词频向量是由0和1组成的多元向量。3.根据权利要求1所述的移动视频直播/监控视频采集源特征分类方法,其特征在于:上述计算每个视频与其他视频的相似度具体为:选取任意一个视频的词频向量组,采用余弦相似度算法计算所选的视频其与其它视频的词频向量组彼此间的相似度,根据相似度的大小进行归类,在剩余的词频向量组中重新选择一个新的词频向量组,重复计算步骤,直到所有的词频向量组被选完,将所有的视频分为若干类。4.根据权利要求3所述的移动视频直播/监控视频...

【专利技术属性】
技术研发人员:曹雪松熊军徐志坤袁媛刘林区李先贵曾科锋丘淦腾古迅涛徐小乐彭尊达
申请(专利权)人:天讯瑞达通信技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1