视频数据聚合处理方法、聚合系统及视频搜索平台技术方案

技术编号：11787658 阅读：61 留言：0更新日期：2015-07-29 11:40

本申请公开了一种视频数据聚合处理方法、聚合系统及视频搜索平台，方法包括步骤：处理单元抽取接收的视频资源中的关键词；处理单元根据关键词查询索引管理器中的索引数据，获取与关键词匹配的候选聚合集，候选聚合集包括若干视频聚合；匹配单元对视频资源和候选聚合集中的视频聚合进行匹配计算，若匹配，则将视频资源写入匹配的视频聚合；若处理单元未获取到与关键词匹配的候选聚合集，则在数据库中新建一个视频聚合，将接收的视频资源写入该新建视频聚合中。本申请中的方法，通过对视频资源抽取关键词，并通过索引管理器获取与关键词匹配的视频聚合集再进行匹配计算，减少了匹配计算次数，优化了匹配算法，提高了对视频资源的聚合处理效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及视频搜索
，具体涉及一种视频数据聚合处理方法、聚合系统及视频搜索平台。
技术介绍
目前采用聚合形式的视频类垂直搜索，需要收录多家第三方站点的播放资源，但是由于各家视频站点的数据格式与内容都不尽相同，如何准确高效的将表示同一个视频内容的资源聚合到一起成为此类视频搜索亟需要解决的问题。现有技术主要采用聚类技术来聚合视频资源，并在比较视频资源和视频聚合相似度时采用基于简单字符串比较的硬匹配方式。在现有技术的处理方式下，收到新的视频资源时，需要逐一与数据库里所有的聚合数据比较才能判断它属于哪个视频聚合，比较次数多，计算量巨大，效率低下，不能实时更新。同时由于各站点数据含有不同的噪声，使用硬匹配的方式来比较，准确率和容错率都很低。
技术实现思路
为了提高对视频资源的聚合处理效率，本申请提供一种视频数据聚合处理方法、聚合系统及视频搜索平台，能提高对视频资源的聚合处理效率。根据本申请的第一方面，本申请提供一种视频数据聚合处理方法，包括步骤：处理单元抽取接收的视频资源中的关键词；处理单元根据所述关键词查询索引管理器中的索引数据，获取与所述关键词匹配的候选聚合集，所述候选聚合集包括若干视频聚合；匹配单元对所述视频资源和所述候选聚合集中的视频聚合进行匹配计算，若匹配，则将所述视频资源写入匹配的视频聚合；若所述处理单元未获取到与所述关键词匹配的候选聚合集，则在数据库中新建一个视频聚合，将接收的所述视频资源写入该新建视频聚合中。进一步地，所述匹配计算包括短文本相似度计算和长文本相似度计算，所述短文本相似度计算通过最...

【技术保护点】
一种视频数据聚合处理方法，其特征在于，包括步骤：处理单元抽取接收的视频资源中的关键词；处理单元根据所述关键词查询索引管理器中的索引数据，获取与所述关键词匹配的候选聚合集，所述候选聚合集包括若干视频聚合；匹配单元对所述视频资源和所述候选聚合集中的视频聚合进行匹配计算，若匹配，则将所述视频资源写入匹配的视频聚合；若所述处理单元未获取到与所述关键词匹配的候选聚合集，则在数据库中新建一个视频聚合，将接收的所述视频资源写入该新建视频聚合中。

【技术特征摘要】

【专利技术属性】
技术研发人员：许春林，唐年鹏，
申请(专利权)人：深圳市云帆世纪科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人