多媒体资源纠错检索方法、多媒体资源服务器及系统技术方案

技术编号:9865903 阅读:97 留言:0更新日期:2014-04-03 01:21
本申请公开了多媒体资源纠错检索方法、服务器及系统,其中,所述方法包括:对关键词进行切分处理以获得两个关键词字段;分别根据关键词字段在资源索引名称库中匹配,对每个关键词字段,获取匹配的资源索引名称;对关键词与匹配的资源索引名称进行相似度分析,选定相似度最高的资源索引名称作为目标资源索引名称;根据目标资源索引名称,结合资源索引名称库中每个资源索引名称与多媒体资源的关联关系,获取与目标资源索引名称对应的多媒体资源。通过获取与关键词部分匹配的资源索引名称,在部分匹配的资源索引名称中获取与关键词相似度最高的资源索引名称,进而获取关联的多媒体资源,用户即使出现输入错误,也能够检索到关联的多媒体资源。

【技术实现步骤摘要】
多媒体资源纠错检索方法、多媒体资源服务器及系统
本申请涉及检索
,具体涉及一种多媒体资源纠错检索方法、多媒体资源服务器及系统。
技术介绍
随着互联网技术的普及和发展,用户越来越多的在互联网上检索自己喜爱的音乐或视频等多媒体资源。例如,在影视类网站上,用户可以在检索框中输入要检索的节目名称或者演员姓名等对自己想观看的视频资源进行检索,在很多情况下,用户可能不能完整而准确的记住视频资源的名称,或者因为误操作而输入了错误的视频资源名称,这时影视类网站往往无法准确匹配到适合的视频资源提供给用户观看。类似的,在用户在音乐网站上,对某一首歌进行检索时,也可能由于无法输入该首歌完整而准确的歌曲名称,导致无法准确匹配到适合的歌曲提供给用户收听。在实际应用中,用户输入的资源索引名称,可以称之为一组文字数据,该文字可以包括汉字、数字、字母等类型,或者其组合,通常可以定义当一位文字数据错误输入或漏输入、多输入时,称为编辑距离为1,在二位文字数据错误输入或漏输入时,称为编辑距离为2,以此类推,统计表明,编辑距离为I的情形占文字数据错误输入或漏输入的95%以上的比例。目前,在现有技术的音乐或影视类网站上,都存在由于用户输入了错误或不完整的资源索引名称而无法匹配到合适的多媒体资源的问题,导致服务器对该类多媒体资源进行检索的成功率低。
技术实现思路
本申请所要解决的技术问题在于提供多媒体资源纠错检索方法、多媒体资源服务器及系统,将关键词进行切分得到两个以上的关键词字段,根据关键词字段与资源索引名称进行匹配,通过对匹配的资源索引名称和关键词进行相似度分析,获取与所述关键词相似度最高的资源索引名称,作为用户真正想输入的目标资源索引名称,根据该目标资源索引名称获取关联的多媒体资源,能够极大地提高用户检索的成功率,并大大提高服务器的资源纠错检索速度。为了解决上述问题,本申请揭示了多媒体资源纠错检索方法,包括:对所述关键词进行切分处理以获得至少两个关键词字段;分别根据所述至少两个关键词字段在资源索引名称库中进行匹配,对于每个关键词字段,获取相匹配的资源索引名称;对所述关键词与所述匹配的资源索引名称进行相似度分析,选定与所述关键词相似度最高的资源索引名称作为目标资源索引名称;根据所述目标资源索引名称,结合所述资源索引名称库中每个资源索引名称与多媒体资源之间的关联关系,获取与所述目标资源索引名称对应的多媒体资源。进一步地,所述对所述关键词进行切分处理以获得至少两个关键词字段的操作,具体包括:对所述关键词采用折半方式进行切分处理以获得两个关键词字段。进一步地,所述资源索引名称库为预先配置,其中保存有资源索引名称以及每个资源索引名称与多媒体资源之间的关联关系;配置所述资源索引名称库时,对在预设时间段内接收到的关键词进行统计,获取在所述预设时间段内接收次数超过第一预设阈值的关键词,将所述接收次数超过第一预设阈值的关键词作为资源索引名称保存在所述资源索引名称库中。进一步地,所述方法还包括:根据所述资源索引名称库中的每个资源索引名称的历史接收次数以及在预设时间段内的接收次数进行加权处理,获取每个资源索引名称的权重值;在获取的与所述关键词相似度最高的资源索引名称为两个以上时,选定其中与所述关键词相似度最高且权重值最高的资源索引名称作为目标资源索引名称。进一步地,所述方法还包括:向客户端发送与所述关键词对应的多媒体资源和所述多媒体资源的描述信息,并通过所述客户端展现所述多媒体资源和所述多媒体资源的描述信息;或向客户端发送与所述关键词对应的多媒体资源,并通过所述客户端展现所述多媒体资源;或向客户端发送与所述关键词对应的多媒体资源的描述信息,并通过所述客户端展现所述描述信息。为了解决上述问题,本申请还揭示了多媒体资源服务器,包括:资源索引名称库,用于保存资源索引名称以及每个资源索引名称与多媒体资源之间的关联关系;切分模块,用于对所述关键词进行切分处理以获得至少两个关键词字段;匹配模块,用于分别根据所述至少两个关键词字段在所述资源索引名称库中进行匹配,对于每个关键词字段,获取相匹配的资源索引名称;相似度分析模块,用于对所述关键词与所述匹配的资源索引名称进行相似度分析,选定与所述关键词相似度最高的资源索引名称作为目标资源索引名称;资源获取模块,用于根据所述目标资源索引名称,结合所述资源索引名称库中每个资源索引名称与多媒体资源之间的关联关系,获取与所述目标资源索引名称对应的多媒体资源。进一步地,所述切分模块,具体用于对所述关键词采用折半方式进行切分处理以获得两个关键词字段。进一步地,所述装置还包括:配置模块,用于预先配置所述资源索引名称库,对在预设时间段内接收到的关键词进行统计,获取在所述预设时间段内接收次数超过第一预设阈值的关键词,将所述接收次数超过第一预设阈值的关键词作为资源索引名称保存在所述资源索引名称库中;关联关系建立模块,用于建立所述资源索引名称库中每个资源索引名称与多媒体资源之间的关联关系,并将所述关联关系保存在所述资源索引名称库中。进一步地,所述装置还包括:加权处理模块;所述加权处理模块,用于根据所述资源索引名称库中的每个资源索引名称的历史接收次数以及在预设时间段内的接收次数进行加权处理,获取每个资源索引名称的权重值,将每个资源索引名称的权重值对应保存在所述资源索引名称库中;所述资源索引名称库,还用于保存每个资源索引名称的权重值;所述相似度分析模块,用于在获取的与所述关键词相似度最高的资源索引名称为两个以上时,选定其中与所述关键词相似度最高且权重值最高的资源索引名称作为目标资源索引名称。为了解决上述问题,本申请还揭示了多媒体资源纠错检索系统,包括:若干客户端以及多媒体资源服务器,其中,所述多媒体资源服务器,包括前述的多媒体资源服务器;所述客户端,用于获取输入的关键词并发送至所述多媒体资源服务器,并接收所述多媒体资源服务器发来的与所述关键词关联的多媒体资源和/或多媒体资源的描述信息并展现。与现有技术相比,本申请可以获得包括以下技术效果:I)通过在用户输入的关键词无法与资源索引名称完全匹配的情况下,对关键词进行切分处理以获得至少两个关键词字段,根据上述的关键词字段在资源索引名称库中进行匹配,即获取与关键词部分匹配的资源索引名称,该获取到的资源索引名称可能包括多个,则进一步的进行相似度分析,获取与关键词相似度最闻的资源索引名称,进而获取关联的多媒体资源,能够使得用户即使出现输入错误,也能够检索到关联的多媒体资源,能够极大地提高用户检索的成功率,并大大提高服务器的资源纠错检索速度。2)本申请进一步的,获取所述关键词的历史接收次数,根据所述关键词的历史接收次数,以及在预设时间段内的接收次数进行加权处理,获取所述资源索引名称的权重值,上述的加权处理时可以侧重考虑预设时间段内的接收次数。使得即使获取的与所述关键词相似度最高的资源索引名称为两个以上,也能够根据权重值,侧重选择最近的一段时间内接收次数更多的资源索引名称,进一步提高检索多媒体资源的成功率。当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。【附图说明】此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请本文档来自技高网...

【技术保护点】
一种多媒体资源纠错检索方法,其特征在于,包括:对所述关键词进行切分处理以获得至少两个关键词字段;分别根据所述至少两个关键词字段在资源索引名称库中进行匹配,对于每个关键词字段,获取相匹配的资源索引名称;对所述关键词与所述匹配的资源索引名称进行相似度分析,选定与所述关键词相似度最高的资源索引名称作为目标资源索引名称;根据所述目标资源索引名称,结合所述资源索引名称库中每个资源索引名称与多媒体资源之间的关联关系,获取与所述目标资源索引名称对应的多媒体资源。

【技术特征摘要】
1.一种多媒体资源纠错检索方法,其特征在于,包括: 对所述关键词进行切分处理以获得至少两个关键词字段; 分别根据所述至少两个关键词字段在资源索引名称库中进行匹配,对于每个关键词字段,获取相匹配的资源索引名称; 对所述关键词与所述匹配的资源索引名称进行相似度分析,选定与所述关键词相似度最高的资源索引名称作为目标资源索引名称; 根据所述目标资源索引名称,结合所述资源索引名称库中每个资源索引名称与多媒体资源之间的关联关系,获取与所述目标资源索引名称对应的多媒体资源。2.如权利要求1所述的多媒体资源纠错检索方法,其特征在于,所述对所述关键词进行切分处理以获得至少两个关键词字段的操作,具体包括: 对所述关键词采用折半方式进行切分处理以获得两个关键词字段。3.如权利要求1所述的多媒体资源纠错检索方法,其特征在于, 所述资源索引名称库为预先配置,其中保存有资源索引名称以及每个资源索引名称与多媒体资源之间的关联关系; 配置所述资源索引名称库时,对在预设时间段内接收到的关键词进行统计,获取在所述预设时间段内接收次数超过第一预设阈值的关键词,将所述接收次数超过第一预设阈值的关键词作为资源索引名称保存在所述资源索引名称库中。4.如权利要求3所述的多媒体资源纠错检索方法,其特征在于,所述方法还包括: 根据所述资源索引名称库中的每个资源索引名称的历史接收次数以及在预设时间段内的接收次数进行加权处理,获取每个资源索引名称的权重值; 在获取的与所述关键词相似度最高的资源索引名称为两个以上时,选定其中与所述关键词相似度最高且权重值最高的资源索引名称作为目标资源索引名称。5.如权利要求1所述的多媒体资源纠错检索方法,其特征在于,所述方法还包括: 向客户端发送与所述关键词对应的多媒体资源和所述多媒体资源的描述信息,并通过所述客户端展现所述多媒体资源和所述多媒体资源的描述信息;或 向客户端发送与所述关键词对应的多媒体资源,并通过所述客户端展现所述多媒体资源;或 向客户端发送与所述关键词对应的多媒体资源的描述信息,并通过所述客户端展现所述描述信息。6.—种多媒体资源服务器,其特征在于,包括: 资源索引名称库,用于保存资源索引名称以及每个资源索引名称与多媒体资源之间的关联关系; ...

【专利技术属性】
技术研发人员:关涛
申请(专利权)人:乐视网信息技术北京股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1