视频搜索方法及系统技术方案

技术编号:5459500 阅读:198 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种视频搜索方法包括:获取作品信息,并建立作品信息数据库;将视频对象和作品ID进行映射;将所述作品信息数据库中的作品信息生成索引;接收搜索词;将所述搜索词在所述索引中进行搜索,并得到搜索结果;输出所述搜索结果。本发明专利技术的有益效果是:视频搜索方法或视频搜索系统,不仅可以在标题文本信息中搜索视频,还可在该视频的其他信息中进行搜索,搜索形式多样,搜索结果更易满足用户需求;同时,本发明专利技术还可无重复地、有序地将视频搜索结果通过结果中间页的形式展示给用户,提升搜索界面美感、提高用户搜索效率,另外,本发明专利技术在结果中间页中的搜索结果,还同时可以提供用户评分,以便用户快速了解该搜索结果的质量。

【技术实现步骤摘要】

本专利技术涉及搜索引擎技术,尤其涉及一种视频搜索方法及系统
技术介绍
随着互联网上信息的飞速增长,网络上充斥了越来越多的冗余信息,而对于在网 络上搜寻自己所需要信息的互联网用户而言,面对这些漫无边际的信息无疑像大海捞针。 搜索引擎的出现无疑在一定程度上为用户的搜索需求带来了很大便利。搜索引擎是一种在 网络上应用的软件系统,其以一定的策略在网络上搜集和发现信息,并在对信息进行处理 和组织后,为用户提供互联网上的信息搜索服务。通常,这种软件系统提供一个网页界面, 让用户在客户端通过浏览器软件提交搜索词,然后很快返回一个可能和用户输入的搜索内 容相关的信息列表。这个列表通常会包括上万个条目,每个条目代表一篇搜索到的相关网 页。过去十几年以来,相应地,众多的互联网搜索引擎及对应的网站应运而生,这中 间的佼佼者包括百度公司的百度搜索(WWW. baidu. com)和谷歌公司的谷歌搜索(www. google, cn)。随着网络技术的不断发展,用户对搜索引擎的要求已经不再满足于只是对文本的 搜索,很多用户还希望可以通过搜索引擎对网络视频进行搜索。然而,在目前的视频搜索 中,存在以下几个问题首先,用户在客户端通过浏览器软件提交搜索词后,其是通过该搜索词在视频标 题中进行搜索,并返回搜索结果,即是只能返回标题文本中包含所述搜索词的视频,例如 如图1所示,当用户在客户端通过浏览器软件提交“恐怖片”为搜索词后,通过搜索引擎的 搜索,返回只有标题文本中包含“恐怖片”的视频,搜索形式单一;其次,在现有技术中,用户在客户端通过浏览器软件提交搜索词后,搜索引擎会将 各大视频网站的不同上传者的不同版本进行搜索并返回给用户,并不是以作品为单位去组 织搜索结果,这样,会导致返回的搜索结果重复地、无序地出现,影响视觉。另外,在现有技术中,对于视频的搜索结果,一般地只是展示出视频链接和视频图 片,展现形式较为单一,不能使用户全方位的了解搜索结果的质量。
技术实现思路
本专利技术的目的在于提供一种改进的视频搜索方法,其不仅可以在标题文本信息中 搜索视频,还可在视频作品信息中搜索视频,同时,本专利技术的视频搜索方法还可无重复地、 有序地将视频搜索结果展示给用户。本专利技术的目的还在于提供一种实现上述视频搜索方法的视频搜索系统。为实现上述专利技术目的之一,本专利技术的一种视频搜索方法,包括以下步骤作品信息建构步骤获取作品信息,并建立作品信息数据库;视频对象分类步骤将视频对象和作品ID进行映射;索引生成步骤将所述作品信息数据库中的作品信息生成索引;接收搜索词步骤接收搜索词;搜索步骤将所述搜索词在所述索引中进行搜索,并得到搜索结果;搜索结果输出步骤输出所述搜索结果。作为本专利技术的进一步改进,所述作品信息建构步骤包括获取作品信息步骤获取作品信息;保存作品信息步骤将所述作品信息存入所述作品信息数据库。作为本专利技术的进一步改进,在所述获取作品信息步骤中是通过SPIDER定向从网 络抓取所述作品信息。作为本专利技术的进一步改进,所述视频对象分类步骤包括识别视频对象类型步骤识别一个视频对象的类型;提取作品名步骤提取与所述视频对象对应的作品名;匹配步骤将所述视频对象通过所述作品名与所述作品信息数据库中的视频进行 匹配,获取作品ID,完成所述视频对象与所述作品ID的映射。作为本专利技术的进一步改进,一个所述作品ID可映射到多个所述视频对象。作为本专利技术的进一步改进,所述接收搜索词步骤包括接收用户输入的搜索词;判断所述搜索词是否属于概括词;若该搜索词为概括词,则进入搜索步骤。作为本专利技术的进一步改进,所述接收搜索词步骤还包括若该搜索词为未概括词,则直接搜索视频对象。作为本专利技术的进一步改进,所述搜索步骤包括去重步骤将所述作品ID重复的视频对象统一为一部视频;排序步骤根据所述作品ID的属性进行排序。作为本专利技术的进一步改进,所述作品ID的属性包括所述作品ID的类型、时间、用 户欢迎程度。作为本专利技术的进一步改进,所述排序步骤还包括判断搜索词中是否包括含有时间定义的关键字;若含有时间定义的关键字,则按照时间维度进行排序。作为本专利技术的进一步改进,所述排序步骤还包括判断搜索词中是否包括含有时间定义的关键字;若未含有时间定义的关键字,则按照类型进行排序。作为本专利技术的进一步改进,在按照类型进行排序后,对同类型的视频,按照用户欢 迎程度进行排序。作为本专利技术的进一步改进,所述搜索结果输出步骤包括输出第一结果页面,在所述第一结果页面中包括至少一个视频集合;接收到用户点击所述视频集合的信息;输出第二结果页面。作为本专利技术的进一步改进,所述第二结果页面包括至少一个与所述视频集合相关的视频对象。作为本专利技术的进一步改进,在第一结果页面中,可接收和展示用户对所述视频集 合的评分信息。作为本专利技术的进一步改进,所述作品信息数据库包含了作品ID与作品信息的对 应关系。作为本专利技术的进一步改进,所述作品信息包括作品的类型、用户对作品的评分、 时间、作品的导演、演员。相应地,作为实现上述另一目的,本专利技术的一种视频搜索系统包括作品信息建构模块用于获取作品信息,并建立作品信息数据库;视频对象分类模块用于将视频对象和作品ID进行映射;索引生成模块用于将所述作品信息数据库中的作品信息生成索引;搜索模块用于将搜索词在所述索引中进行搜索,并得到搜索结果;数据交互模块用于接收所述搜索词,以及输出所述搜索结果。作为本专利技术的进一步改进,所述作品信息建构模块包括获取作品信息单元用于获取作品信息;作品信息数据库用于储存所述作品信息。作为本专利技术的进一步改进,在所述获取作品信息单元中是通过SPIDER定向从网 络抓取所述作品信息。作为本专利技术的进一步改进,所述视频对象分类模块包括识别视频对象类型单元用于识别一个视频对象的类型;提取作品名单元用于提取与所述视频对象对应的作品名;匹配单元用于将所述视频对象通过所述作品名与所述作品信息数据库中的视频 进行匹配,获取作品ID,完成所述视频对象与所述作品ID的映射。作为本专利技术的进一步改进,一个所述作品ID可映射到多个所述视频对象。作为本专利技术的进一步改进,所述数据交互模块包括搜索词分析单元用于接收搜索词;搜索结果输出单元用于输出所述搜索结果;用户评分单元用于接收用户对所述搜索结果的评分。作为本专利技术的进一步改进,所述视频搜索系统还包括一评分数据库用于存储用 户对所述搜索结果的评分。作为本专利技术的进一步改进,所述搜索结果输出单元还包括第一结果页面输出子单元输出第一结果页面,在所述第一结果页面中包括至少 一个视频集合;第二结果页面输出子单元在接收到用户点击所述视频集合的信息后,输出第二 结果页面。作为本专利技术的进一步改进,所述第二结果页面包括至少一个与所述视频集合相关 的视频对象。作为本专利技术的进一步改进,所述搜索模块包括去重模块用于将所述作品ID重复的视频对象统一为一部视频;排序模块用于根据所述作品ID的属性进行排序。作为本专利技术的进一步改进,所述作品ID的属性包括所述作品ID的类型、时间、用 户欢迎程度。作为本专利技术的进一步改进,所述作品信息数据库包含了作品ID与作品信息的对 应关系。作为本专利技术的进一步改进,所述作品信息包括作品的类型、用户对作品的评分、 时间、作品的导演、演员。 与现有技术相比,本专利技术的有益效果是视频搜索方法或视频搜本文档来自技高网
...

【技术保护点】
一种视频搜索方法,其特征在于,所述视频搜索方法包括以下步骤:作品信息建构步骤:获取作品信息,并建立作品信息数据库;视频对象分类步骤:将视频对象和作品ID进行映射;索引生成步骤:将所述作品信息数据库中的作品信息生成索引;接收搜索词步骤:接收搜索词;搜索步骤:将所述搜索词在所述索引中进行搜索,并得到搜索结果;搜索结果输出步骤:输出所述搜索结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈海坤
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1