视频资源信息的排序方法及其系统技术方案

技术编号:9853437 阅读:81 留言:0更新日期:2014-04-02 17:40
本发明专利技术公开了一种视频资源信息的排序方法及其系统,其中该方法包括:从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集;提供排序参数信息,并接收用户选定的排序参数;根据接收到的排序参数对倒排索引结果集进行排序。通过本发明专利技术提高了检索效率并提升了用户体验。

【技术实现步骤摘要】
视频资源信息的排序方法及其系统
本专利技术涉及信息检索技术,尤其涉及一种视频资源信息的排序方法及其系统。
技术介绍
随着科技的发展,越来越多的用户通过互联网搜索并观看各种视频。由于互联网提供的视频信息十分丰富,并具有不断变化及更新的特点,随之产生了多种搜索引擎进行视频信息检索。在关系数据库系统中,索引是检索数据最有效率的方式。但对于全网的视频搜索引擎,并不能满足其特殊要求。由于搜索引擎面对的是全网的海量视频数据,例如乐视网等大型的视频网站搜索引擎索引都是亿级甚至几千亿的网页数量,面对如此海量的视频数据,使得数据库系统很难有效的管理。在进行全网搜索时,会产生大量的检索结果,而用户需要的有用信息不能快速地查找到,不能够满足排序需求。综上所述可知,现有技术中存在对于海量视频信息的大量检索结果没有提供有效排序方案的技术问题,因此有必要提出改进的技术方案解决上述问题。
技术实现思路
本专利技术的主要目的在于提供一种视频资源信息的排序方法及其系统,以解决现有技术存在的对于海量视频信息的大量检索结果没有有效排序方案的技术问题。为了解决上述问题,根据本专利技术的一方面,提供了一种视频资源信息的排序方法,其包括:从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集;提供排序参数信息,并接收用户选定的排序参数;根据接收到的排序参数对倒排索引结果集进行排序。其中,所述排序参数信息包括:视频类型、上映时间、播放时长、视频文件相关的信肩、O其中,所述方法还包括:建立视频文件的倒排索引文件;所述从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集,具体为:接收对于视频资源信息的检索信息;在所述倒排索引文件中匹配所述检索信息;根据与所述检索信息匹配的所述倒排索引文件中的数据得到倒排索引结果集。其中,所述建立视频文件的倒排索引文件包括:通过预设的分词方式对视频文件信息进行分词处理得到关键词;建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。其中,所述方法还包括:提供词库,所述词库的数据来源包括:基础词库、视频版权词库、用户生成内容;所述通过预设的分词方式对视频文件信息进行分词处理得到关键词的步骤包括:通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇;根据所述词库对所述初步分词词汇进行调整,得到关键词。根据本专利技术的另一方面,还提供了一种视频资源信息的排序系统,其包括:获取模块,用于从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集;参数提供模块,用于提供排序参数信息;参数接收模块,用于接收用户选定的排序参数;排序模块,用于根据所述接收模块接收到的排序参数对倒排索引结果集进行排序。其中,所述排序参数信息包括:视频类型、上映时间、播放时长、视频文件相关的信肩、O其中,所述系统还包括:建立模块,用于建立视频文件的倒排索引文件;所述获取模块进一步用于,用于接收对于视频资源信息的检索信息,在所述倒排索引文件中匹配所述检索信息,根据与所述检索信息匹配的所述倒排索引文件中的数据得到倒排索引结果集。其中,所述建立模块包括:关键词获取模块,用于通过预设的分词方式对视频文件信息进行分词处理得到关键词;倒排索引建立模块,用于建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。其中,所述系统还包括:词库维护模块,用于建立并维护词库,所述词库的数据来源包括:基础词库、视频版权词库、用户生成内容;所述关键词获取模块通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇;根据所述词库对所述初步分词词汇进行调整,得到关键词。根据本专利技术的技术方案,通过获取视频文件的倒排索引结果集,根据接收到的排序参数对倒排索引结果集进行排序,在面对海量的视频检索信息时,通过倒排索引缩小了结果集,通过正排二次排序满足了排序需求,从而提高了检索效率并提升了用户体验。【附图说明】此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术一个实施例的视频资源信息的排序方法的流程图;图2是根据本专利技术另一实施例的视频资源信息的排序方法的流程图;图3是根据本专利技术一个实施例的视频资源信息的排序系统的结构框图;图4是根据本专利技术另一实施例的视频资源信息的排序系统的结构框图。【具体实施方式】为使本专利技术的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本专利技术作进一步地详细说明。根据本专利技术的实施例,提供了 一种视频资源信息的排序方法。图1是根据本专利技术实施例的视频资源信息的排序方法的流程图,如图1所示,该方法包括以下步骤(步骤S102-S106):步骤S102,从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集。通过与多种来源的数据源相匹配的数据模型,建立符合搜索架构的数据结构,从而建立视频文件的倒排索引文件。提供对外(用户)的查询引擎,接收对于视频资源信息的检索信息,在所述倒排索引文件中匹配所述检索信息,根据与所述检索信息匹配的所述倒排索引文件中的数据倒排索引结果,并输出包含有多个视频信息的倒排索引结果集。其中,上述的数据源的来源渠道包括:DB (视频数据库)、xml (可扩展标记语言)、文件系统等。步骤S104,提供排序参数信息,并接收用户选定的排序参数。在实际应用中,可以通过用户界面(User Interface)与用户交互,提供用于排序的参数信息、并接收用户选定的排序参数。所述排序参数信息包括但不限于:上映时间、播放时长、视频文件相关的信息。其中,上映时间或称为发布时间,是视频信息首次上映或发布的年、月、日等时间信息;播放时长,是视频信息的时间长度的信息;视频文件相关的信息,是根据该视频文件的特点提供的信息,对于专辑来说,包括期数、辑数、以及视频内容、视频中出现的人员姓名等等进一步详细的信息。步骤S106,根据接收到的排序参数对倒排索引结果集进行排序。通过上述实施例,在面对海量的视频检索信息时,通过倒排索引缩小了结果集,通过正排排序满足了排序需求,从而提高了检索效率并提升了用户体验。下面结合图2详细描述本专利技术实施例。图2是根据本专利技术实施例的视频资源信息的排序方法的优选处理方案的流程图,如图2所示,包括以下步骤:步骤S202,提供词库,所述词库的数据来源包括但不限于:基础词库、视频版权词库、用户生成内容(User-generated content,简称为UGC)。其中,基础词库包括各种字典和词典,由于视频文件并不严格与词典的词条相一致,因此还需用到视频版权词库。视频版权词库为根据具有版权的视频资源信息得到的词库,该词库能够符合视频文件信息分词处理的需求。而UGC是由用户生成的或提供的或原创的内容,补充了基础词库和视频版权词库中不具有的一些新词。通过上述多种词库相互配合及补充,经过分词处理后能够得到较理想的关键词。步骤S204,通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇。其中,预设的分词方式例如二元分词法、最大匹配法、统计方法等算法,此处不赘述。步骤S206,根据所述词库对初步分词词汇进行调整本文档来自技高网...

【技术保护点】
一种视频资源信息的排序方法,其特征在于,包括:从预先建立的视频文件的倒排索引文件中获取对于所述视频文件的倒排索引结果集;提供排序参数信息,并接收用户选定的排序参数;根据接收到的排序参数对倒排索引结果集进行排序。

【技术特征摘要】
1.一种视频资源信息的排序方法,其特征在于,包括: 从预先建立的视频文件的倒排索引文件中获取对于所述视频文件的倒排索引结果集; 提供排序参数信息,并接收用户选定的排序参数; 根据接收到的排序参数对倒排索引结果集进行排序。2.根据权利要求1所述的方法,其特征在于,所述排序参数信息包括:视频类型、上映时间、播放时长、视频文件相关的信息。3.根据权利要求1所述的方法,其特征在于,还包括: 建立视频文件的倒排索引文件; 所述从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集,具体为: 接收对于视频资源信息的检索信息; 在所述倒排索引文件中匹配所述检索信息;` 根据与所述检索信息匹配的所述倒排索引文件中的数据得到倒排索引结果集。4.根据权利要求3所述的方法,其特征在于,所述建立视频文件的倒排索引文件包括: 通过预设的分词方式对视频文件信息进行分词处理得到关键词; 建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。5.根据权利要求4所述的方法,其特征在于,还包括: 提供词库,所述词库的数据来源包括:基础词库、视频版权词库、用户生成内容; 所述通过预设的分词方式对视频文件信息进行分词处理得到关键词的步骤包括:通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇; 根据所述词库对所述初步分词词汇进行调整,得到关键词。6....

【专利技术属性】
技术研发人员:曹坤波郑磊
申请(专利权)人:乐视网信息技术北京股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1