一种视频资源的识别和聚合的方法及系统技术方案

技术编号:17918423 阅读:71 留言:0更新日期:2018-05-10 21:58
本发明专利技术公开了一种视频资源的识别和聚合的方法及系统,通过接收待识别视频资源,根据预设影视特征库对待识别视频资源进行特征识别和抽取,构建与待识别视频资源对应的特征集;根据特征集通过预设影视资料索引服务表获取与特征集相似的N个影视资料候选集;采用预设算法计算待识别视频资源与每个影视资料候选集中的影视资料的相似分值;将相似分值中大于预设阈值,且相似分值最大的影视资料作为待识别视频资源的所属影视资料,将待识别视频资源与相似分值最大的影视资料的视频资源进行聚合操作。本发明专利技术可以识别未知的影视视频以及识别播放源,将相同视频资源的播放源聚合在一起给用户展现更丰富和规范的播放源。

【技术实现步骤摘要】
一种视频资源的识别和聚合的方法及系统
本专利技术涉及网络视频处理
,特别是涉及一种视频资源的识别和聚合的方法及系统。
技术介绍
影视视频是人们日常生活中广泛接触的一类视频资源,随着互联网的迅速发展,影视视频不只存在于传统广播电视系统中,也大量的出现在网络资源库中。对于影视视频搜索平台,为了提供更全的视频资源,因此需要收录多家视频站点的视频资源,但同一视频资源可能存在于不同的站点,例如“速度与激情”,优酷、腾讯等各家站点都有该视频资源,但是不同的站点视频的描述信息存在差异,因此,需要将不同站点的同一视频资源正确的聚合到一起,统一对外展示。除此之外,对于用户上传的分散的影视视频资源,视频资源描述质量较差,对外展现用户体验相对较差,所以需要将视频资源正确识别为某部影视剧,补充资源的相关信息,并与其他相同的播放源聚合在一起,因此,需要解决对未知播放资源的识别,以及相同视频资源及播放源的聚合。目前对于视频资源的识别和聚合主要采用标题相似度来进行识别和聚合视频资源,在判断视频资源是否属于已有视频资料时,需要遍历视频资源库里所有的视频资源做比较才能判断,比较次数多,效率较低;而且对于同一视频资源各家站点的描述由于没有一个规范的描述存在差异,若以任一一家站点的描述作为基准都无法保证视频资源描述的准确性和完整性;且由于各家站点的视频资源的描述数据参差不齐,进行相似度计算时会因为基准数据的质量不同,导致不同的聚合结果,聚合的召回率低且正确率也不高。
技术实现思路
本专利技术的目的在于提出一种视频资源的识别和聚合的方法及系统,以实现对未知的影视视频进行识别,对不完善的视频资料进行补充再展现给用户;以及实现识别第三方站点的播放源,将相同的播放源聚合在一起,给用户展现更丰富的播放源。为达到上述目的,本专利技术提供了以下技术方案:一种视频资源的识别和聚合的方法,包括:接收待识别视频资源,根据预设影视特征库对所述待识别视频资源进行特征识别和抽取,构建与所述待识别视频资源对应的特征集;根据所述特征集通过所述预设影视资料索引服务表获取与所述特征集相似的N个影视资料候选集,其中,N为大于等于1的正整数;采用预设算法计算所述待识别视频资源与每个所述影视资料候选集中的影视资料的相似分值;将所述相似分值中大于预设阈值,且所述相似分值最大的影视资料作为所述待识别视频资源的所属影视资料,将所述待识别视频资源与所述相似分值最大的影视资料的视频资源进行聚合操作。优选的,还包括:将所述待识别视频资源与所述所属影视资料对应的播放源标记为相同的播放源,对所述播放源进行聚合并统一对外展示。优选的,所述构建预设影视特征库,包括:根据全网影视资料库和明星数据库建立标准影视信息候选库,并建立影视资料索引服务;将所述标准影视信息库作为标准参照数据,提取影视剧信息的特征值;以所述特征值构建预设影视特征库。优选的,所述接收待识别视频资源,根据预设影视特征库对所述待识别视频资源进行特征识别和抽取,构建与所述视频资源待识别对应的特征集,包括:接收所述待识别视频资源,对所述待识别视频资源进行清洗和归一化,得到所述待识别视频资源对应的影视信息;根据所述影视特征库对所述影视信息进行特征识别和抽取,得到所述待识别视频资源的特征值;根据所述特征值构建与所述待识别视频资源对应的特征集。优选的,所述采用预设算法计算所述待识别视频资源与每个所述影视资料候选集中的影视资料的相似分值,包括:确定所述待识别视频资源对应的特征集中的所述特征值的特征分类,所述特征分类包括:决定性特征、限制性特征和一般性特征;通过加权相似算法计算决定性特征分值、决定性特征分值以及一般性特征分值,则所述待识别视频资源与所述影视资料候选集中的影视资料的相似分值为所述决定性特征分值、所述限制性特征分值以及所述一般性特征分值的乘积。一种视频资源的识别和聚合的系统,包括:构建模块,用于接收待识别视频资源,根据预设影视特征库对所述待识别视频资源进行特征识别和抽取,构建与所述待识别视频资源对应的特征集;获取模块,用于根据所述特征集通过所述预设影视资料索引服务表获取与所述特征集相似的N个影视资料候选集,其中,N为大于等于1的正整数;计算模块,用于采用预设算法计算所述待识别视频资源与每个所述影视资料候选集中的影视资料的相似分值;第一聚合模块,用于将所述相似分值中大于预设阈值,且所述相似分值最大的影视资料作为所述待识别视频资源的所属影视资料,将所述待识别视频资源与所述相似分值最大的影视资料的视频资源进行聚合操作。优选的,还包括:第二聚合模块,用于将所述待识别视频资源与所述所属影视资料对应的播放源标记为相同的播放源,对所述播放源进行聚合并统一对外展示。优选的,所述构建模块还用于:根据全网影视资料库和明星数据库建立标准影视信息候选库,并建立影视资料索引服务;将所述标准影视信息库作为标准参照数据,提取影视剧信息的特征值;以所述特征值构建预设影视特征库。优选的,所述构建单元包括:处理单元,用于接收所述待识别视频资源,并对所述待识别视频资源进行清洗和归一化,得到所述待识别视频资源对应的影视信息;识别和抽取单元,用于根据所述影视特征库对所述影视信息进行特征识别和抽取,得到所述待识别视频资源的特征值;构建子单元,用于根据所述特征值构建与所述待识别视频资源对应的特征集。优选的,所述计算模块包括:分类单元,用于确定所述待识别视频资源对应的特征集中的所述特征值的特征分类,所述特征分类包括:决定性特征、限制性特征和一般性特征;计算单元,用于通过加权相似算法计算决定性特征分值、决定性特征分值以及一般性特征分值,则所述待识别视频资源与所述影视资料候选集中的影视资料的相似分值为所述决定性特征分值、所述限制性特征分值以及所述一般性特征分值的乘积。经由上述的技术方案可知,与现有技术相比,本专利技术公开了一种视频资源的识别和聚合的方法及系统,通过接收待识别视频资源,根据预设影视特征库对待识别视频资源进行特征识别和抽取,构建与待识别视频资源对应的特征集;根据特征集通过预设影视资料索引服务表获取与特征集相似的N个影视资料候选集;采用预设算法计算待识别视频资源与每个影视资料候选集中的影视资料的相似分值;将相似分值中大于预设阈值,且相似分值最大的影视资料作为待识别视频资源的所属影视资料,将待识别视频资源与相似分值最大的影视资料的视频资源进行聚合操作。本专利技术通过创建影视资料库,并根据影视资料库建立标准的影视特征库,可以识别未知的影视视频做,使用影视资料的信息对不完善的视频资料进行补充再展现给用户;且可以识别第三方站点的播放源,将相同视频资源的的播放源聚合在一起,给用户展现更丰富和规范的播放源。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种视频资源的识别和聚合的方法流程示意图;图2为本专利技术实施例提供的图1中步骤S101的具体流程示意图;图3为本专利技术实施例提供的图1中步骤S103的具体流程示意图;图4为本专利技术实施例提供的一种视频资源的识别和聚合本文档来自技高网...
一种视频资源的识别和聚合的方法及系统

【技术保护点】
一种视频资源的识别和聚合的方法,其特征在于,包括:接收待识别视频资源,根据预设影视特征库对所述待识别视频资源进行特征识别和抽取,构建与所述待识别视频资源对应的特征集;根据所述特征集通过所述预设影视资料索引服务表获取与所述特征集相似的N个影视资料候选集,其中,N为大于等于1的正整数;采用预设算法计算所述待识别视频资源与每个所述影视资料候选集中的影视资料的相似分值;将所述相似分值中大于预设阈值,且所述相似分值最大的影视资料作为所述待识别视频资源的所属影视资料,将所述待识别视频资源与所述相似分值最大的影视资料的视频资源进行聚合操作。

【技术特征摘要】
1.一种视频资源的识别和聚合的方法,其特征在于,包括:接收待识别视频资源,根据预设影视特征库对所述待识别视频资源进行特征识别和抽取,构建与所述待识别视频资源对应的特征集;根据所述特征集通过所述预设影视资料索引服务表获取与所述特征集相似的N个影视资料候选集,其中,N为大于等于1的正整数;采用预设算法计算所述待识别视频资源与每个所述影视资料候选集中的影视资料的相似分值;将所述相似分值中大于预设阈值,且所述相似分值最大的影视资料作为所述待识别视频资源的所属影视资料,将所述待识别视频资源与所述相似分值最大的影视资料的视频资源进行聚合操作。2.根据权利要求1所述的方法,其特征在于,还包括:将所述待识别视频资源与所述所属影视资料对应的播放源标记为相同的播放源,对所述播放源进行聚合并统一对外展示。3.根据权利要求1所述的方法,其特征在于,所述构建预设影视特征库,包括:根据全网影视资料库和明星数据库建立标准影视信息候选库,并建立影视资料索引服务;将所述标准影视信息库作为标准参照数据,提取影视剧信息的特征值;以所述特征值构建预设影视特征库。4.根据权利要求1所述的方法,其特征在于,所述接收待识别视频资源,根据预设影视特征库对所述待识别视频资源进行特征识别和抽取,构建与所述视频资源待识别对应的特征集,包括:接收所述待识别视频资源,对所述待识别视频资源进行清洗和归一化,得到所述待识别视频资源对应的影视信息;根据所述影视特征库对所述影视信息进行特征识别和抽取,得到所述待识别视频资源的特征值;根据所述特征值构建与所述待识别视频资源对应的特征集。5.根据权利要求1所述的方法,其特征在于,所述采用预设算法计算所述待识别视频资源与每个所述影视资料候选集中的影视资料的相似分值,包括:确定所述待识别视频资源对应的特征集中的所述特征值的特征分类,所述特征分类包括:决定性特征、限制性特征和一般性特征;通过加权相似算法计算决定性特征分值、决定性特征分值以及一般性特征分值,则所述待识别视频资源与所述影视资料候选集中的影视资料的相似分值为所述决定性特征分值、所述限制性特征分值以及所述一般性...

【专利技术属性】
技术研发人员:李娜
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1