基于节目关系的视频节目的搜索方法和装置制造方法及图纸

技术编号:11514428 阅读:73 留言:0更新日期:2015-05-27 22:35
本发明专利技术提供了一种基于节目关系的视频节目的搜索方法和装置。该方法主要包括:建立多个视频节目之间的关系网络,对用户输入的搜索关键词进行结构化处理得到搜索向量;从搜索向量中提取出视频节目的相关信息,利用相关信息通过设定的关系值计算公式分别计算出搜索向量与各个视频节目之间的关系值;将和搜索向量之间的关系值大于设定的关系判断阈值的各个视频节目作为搜索关键词对应的初始视频搜索结果,利用关系网络对初始视频搜索结果进行扩展,得到最终的视频搜索结果。本发明专利技术实现了搜索关键词对应的搜索向量和初始视频搜索结果都可以通过节目关系网络进行扩展,从而丰富了搜索结果,也使得一维的搜索结果立体化得到多维的视频搜索结果。

【技术实现步骤摘要】
基于节目关系的视频节目的搜索方法和装置
本专利技术涉及视频搜索
,尤其涉及一种基于节目关系的视频节目的搜索方法和装置。
技术介绍
当前的视频或视频管理网站都有视频节目的一维搜索功能,该一维搜索功能的实现原理示意图如图1所示,一般通过关键词匹配视频的名称,简介等语义信息实现。上述一维搜索的搜索结果集合中的单个数据对象与搜索条件之间的关系呈现直接相关性,搜索结果按照其时间排序或标题字典排序构成节目序列。上述一维搜索的缺点为:该一维搜索得到的搜索结果中所有单个数据与检索条件存在直接相关性,而数据之间的相关性则被忽略,给用户提供的视频节目的搜索结果也是一维的,不全面的。
技术实现思路
本专利技术的实施例提供了一种基于节目关系的视频节目的搜索方法和装置,以实现给用户提供更为丰富的视频节目的搜索结果。本专利技术提供了如下方案:一种基于节目关系的视频节目的搜索方法,计算出两两视频节目之间的关系,建立多个视频节目之间的关系网络,包括:对用户输入的搜索关键词进行结构化处理得到搜索向量;从所述搜索向量中提取出视频节目的相关信息,利用所述相关信息通过设定的关系值计算公式分别计算出所述搜索向量与各个视频节目之间的关系值;将和所述搜索向量之间的关系值大于设定的关系判断阈值的各个视频节目作为所述搜索关键词对应的初始视频搜索结果,利用所述关系网络对所述初始视频搜索结果进行扩展,得到最终的视频搜索结果。所述的计算出两两视频节目之间的关系,建立多个视频节目之间的关系网络,包括:从视频节目中提取出节目的相关信息,对所述相关信息进行结构化处理得到视频节目的结构化信息,所述结构化处理包括清除停用词,去除非法字符,分词中的至少一项,根据所述视频节目的结构化信息通过词频-反词频技术建立视频节目的属性空间;根据各个视频节目的属性空间,计算出两个视频节目之间的相同属性之间的相关性值,将多个所述相关性值进行加权求和,将加权求和的结果进行归一化处理,得到两个视频节目之间的关系值;基于计算出的两两视频节目之间的关系,建立多个视频节目之间的关系网络,将所述关系网络和各个视频节目的属性空间存储在视频数据库中。所述的根据各个视频节目的属性空间,计算出两个视频节目之间的相同属性之间的相关性值,将多个所述相关性值进行加权求和,将加权求和的结果进行归一化处理,得到两个视频节目之间的关系值,包括:所述视频节目的属性空间中包括导演,演员,编剧,国家,拍摄年份,剧情中的至少一项,设两个视频节目为pi和pj;所述视频节目pi、pj之间的导演相关性值的计算方法为:将节目pi的导演集mi记作m(pi,mi),节目pj的导演集mj记作m(pj,mj),存在mi∩mj≠Φ,则视频节目pi、pj之间的导演相关性值为m(pi,pj),所述m表示包括所有导演的导演集,|mi|表示导演集mi的模值,|mj|表示导演集mj的模值;所述视频节目pi、pj之间的演员相关性值的计算方法为:将节目pi的演员集合ai记作a(pi,ai),节目pj的演员集合aj记作a(pj,aj),存在ai∩aj≠Φ,则视频节目pi、pj之间的演员相关性值为a(pi,pj),所述a表示包括所有演员的演员集,|ai|表示演员集ai的模值,|aj|表示演员集aj的模值;所述视频节目pi、pj之间的编剧相关性值的计算方法为:将节目pi的编剧集合ei记作e(pi,ei),节目pj的编剧集合ej记作e(pj,ej),存在ei∩ej≠Φ,则视频节目pi、pj之间的编剧相关性值为e(pi,pj),所述e表示包括所有编剧的编剧集,|ei|表示编剧集ei的模值,|ej|表示编剧集ej的模值;所述视频节目pi、pj之间的拍摄年份相关性值的计算方法为:将节目pi的拍摄年份yi记作y(pi,yi),将节目pj的拍摄年份yj记作y(pj,yj),则视频节目pi、pj之间的拍摄年份相关性值为y(pi,pi),所述视频节目pi、pj之间的国家相关性值的计算方法为:将节目pi的发行国家ci记作c(pi,ci),将节目pj的发行国家cj记作c(pj,cj),存在ci=cj,则视频节目pi、pj之间的国家相关性值为c(pi,pj),所述视频节目pi、pj之间的剧情相关值的计算方法为:将节目pi的标签集ti记作t(pi,ti),将节目pj的标签集tj记作t(pj,tj),存在标签的语义相似性,记作ti≈tj,那么pi和pj存在标签相关性,则视频节目pi、pj之间的标签相关性值为t(pi,pj),其中f(tk)是通过指定搜索引擎利用关键词tk检索网页得到的记录总数,f(tk,tl)是通过指定搜索引擎利用关键词tk,tl共同检索网页得到的记录总数,G是上述指定搜索引擎对应的网页总数;对所述视频节目pi、pj之间的导演相关性值、演员相关性值、编剧相关性值、拍摄年份相关性值、国家相关性值、标签相关性值进行加权求和,得到视频节目pi和pj的关系大小rel(pi,pj),rel(pi,pj)=αm(pi,pj)+βa(pi,pj)+χe(pi,pj)+δy(pi,pj)+εc(pi,pj)+γt(pi,pj)其中,α,β,χ,δ,ε,γ为设定的权重值,α+β+χ+δ+ε+γ=1对所述rel(pi,pj)进行量化,得到两个节目pi和pj之间的关系值。所述的从所述搜索向量中提取出视频节目的相关信息,利用所述相关信息通过设定的关系值计算公式分别计算出所述搜索向量与各个视频节目之间的关系值,包括:从搜索向量中提取出节目的相关信息,对所述相关信息进行结构化处理得到搜索向量的结构化信息,所述结构化处理包括清除停用词,去除非法字符,分词中的至少一项,根据所述搜索向量的结构化信息通过词频-反词频技术建立搜索向量的属性空间;根据搜索向量的属性空间和所述视频数据库中存储的各个视频节目的属性空间,计算出所述搜索向量和所述视频数据库中存储的各个视频节目之间的相同属性之间的相关性值,将多个所述相关性值进行加权求和,将加权求和的结果进行归一化处理,得到所述搜索向量和所述视频数据库中存储的各个视频节目之间的关系值。所述的利用所述关系网络对所述初始视频搜索结果进行扩展,得到最终的视频搜索结果,包括:选取所述初始视频搜索结果中的某个视频节目,通过所述关系网络获取和所述某个视频节目之间的关系值大于设定数值的二级视频节目,将该二级视频节目作为上述搜索关键词对应的二级视频搜索结果;或者,从视频数据库中获取所述某个视频节目的属性空间信息,针对所述某个视频节目的特定属性信息对所述初始视频搜索结果进行扩展,根据所述关系网络获取和所述某个视频节目之间特定属性信息对应的相关性值大于设定数值的二级视频节目,将该二级视频节目作为所述搜索关键词对应的二级视频搜索结果;将所述初始视频搜索结果、二级视频搜索结果进行综合,得到所述搜索关键词对应的最终的多维的视频搜索结果。一种基于节目关系的视频节目的搜索装置,包括:关系网络建立模块,用于计算出两两视频节目之间的关系,建立多个视频节目之间的关系网络;搜索向量处理模块,用于对用户输入的搜索关键词进行结构化处理得到搜索向量,从所述搜索向量中提取出视频节目的相关信息,利用所述相关信息通过设定的关系值计算公式分别计算出所述搜索向量与各个视频节目之间的关系值;初始搜索处理模块,用于将和所本文档来自技高网...

【技术保护点】
一种基于节目关系的视频节目的搜索方法,其特征在于,计算出两两视频节目之间的关系,建立多个视频节目之间的关系网络,包括:对用户输入的搜索关键词进行结构化处理得到搜索向量;从所述搜索向量中提取出视频节目的相关信息,利用所述相关信息通过设定的关系值计算公式分别计算出所述搜索向量与各个视频节目之间的关系值;将和所述搜索向量之间的关系值大于设定的关系判断阈值的各个视频节目作为所述搜索关键词对应的初始视频搜索结果,利用所述关系网络对所述初始视频搜索结果进行扩展,得到最终的视频搜索结果。

【技术特征摘要】
1.一种基于节目关系的视频节目的搜索方法,其特征在于,计算出两两视频节目之间的关系,建立多个视频节目之间的关系网络,包括:对用户输入的搜索关键词进行结构化处理得到搜索向量;从所述搜索向量中提取出视频节目的至少一个相关信息,利用所述至少一个相关信息通过设定的关系值计算公式分别计算出所述搜索向量与各个视频节目之间的关系值,其中,所述相关信息包括:视频导演、演员、编剧、国家、拍摄年份和剧情;将和所述搜索向量之间的关系值大于设定的关系判断阈值的各个视频节目作为所述搜索关键词对应的初始视频搜索结果,利用所述关系网络对所述初始视频搜索结果进行扩展,得到最终的视频搜索结果。2.根据权利要求1所述的基于节目关系的视频节目的搜索方法,其特征在于,所述的计算出两两视频节目之间的关系,建立多个视频节目之间的关系网络,包括:从视频节目中提取出节目的相关信息,对所述相关信息进行结构化处理得到视频节目的结构化信息,所述结构化处理包括清除停用词,去除非法字符,分词中的至少一项,根据所述视频节目的结构化信息通过词频-反词频技术建立视频节目的属性空间;根据各个视频节目的属性空间,计算出两个视频节目之间的相同属性之间的相关性值,将多个所述相关性值进行加权求和,将加权求和的结果进行归一化处理,得到两个视频节目之间的关系值;基于计算出的两两视频节目之间的关系,建立多个视频节目之间的关系网络,将所述关系网络和各个视频节目的属性空间存储在视频数据库中。3.根据权利要求2所述的基于节目关系的视频节目的搜索方法,其特征在于,所述的根据各个视频节目的属性空间,计算出两个视频节目之间的相同属性之间的相关性值,将多个所述相关性值进行加权求和,将加权求和的结果进行归一化处理,得到两个视频节目之间的关系值,包括:所述视频节目的属性空间中包括导演,演员,编剧,国家,拍摄年份,剧情中的至少一项,设两个视频节目为pi和pj;所述视频节目pi、pj之间的导演相关性值的计算方法为:将节目pi的导演集mi记作m(pi,mi),节目pj的导演集mj记作m(pj,mj),存在mi∩mj≠Φ,则视频节目pi、pj之间的导演相关性值为m(pi,pj),所述m表示包括所有导演的导演集,|mi|表示导演集mi的模值,|mj|表示导演集mj的模值;所述视频节目pi、pj之间的演员相关性值的计算方法为:将节目pi的演员集合ai记作a(pi,ai),节目pj的演员集合aj记作a(pj,aj),存在ai∩aj≠Φ,则视频节目pi、pj之间的演员相关性值为a(pi,pj),所述a表示包括所有演员的演员集,|ai|表示演员集ai的模值,|aj|表示演员集aj的模值;所述视频节目pi、pj之间的编剧相关性值的计算方法为:将节目pi的编剧集合ei记作e(pi,ei),节目pj的编剧集合ej记作e(pj,ej),存在ei∩ej≠Φ,则视频节目pi、pj之间的编剧相关性值为e(pi,pj),所述e表示包括所有编剧的编剧集,|ei|表示编剧集ei的模值,|ej|表示编剧集ej的模值;所述视频节目pi、pj之间的拍摄年份相关性值的计算方法为:将节目pi的拍摄年份yi记作y(pi,yi),将节目pj的拍摄年份yj记作y(pj,yj),则视频节目pi、pj之间的拍摄年份相关性值为y(pi,pi),所述视频节目pi、pj之间的国家相关性值的计算方法为:将节目pi的发行国家ci记作c(pi,ci),将节目pj的发行国家cj记作c(pj,cj),存在ci=cj,则视频节目pi、pj之间的国家相关性值为c(pi,pj),所述视频节目pi、pj之间的剧情相关值的计算方法为:将节目pi的标签集ti记作t(pi,ti),将节目pj的标签集tj记作t(pj,tj),存在标签的语义相似性,记作ti≈tj,那么pi和pj存在标签相关性,则视频节目pi、pj之间的标签相关性值为t(pi,pj),其中f(tk)是通过指定搜索引擎利用关键词tk检索网页得到的记录总数,f(tk,tl)是通过指定搜索引擎利用关键词tk,tl共同检索网页得到的记录总数,G是上述指定搜索引擎对应的网页总数;对所述视频节目pi、pj之间的导演相关性值、演员相关性值、编剧相关性值、拍摄年份相关性值、国家相关性值、标签相关性值进行加权求和,得到视频节目pi和pj的关系大小rel(pi,pj),rel(pi,pj)=αm(pi,pj)+βa(pi,pj)+χe(pi,pj)+δy(pi,pj)+εc(pi,pj)+γt(pi,pj)其中,α,β,χ,δ,ε,γ为设定的权重值,α+β+χ+δ+ε+γ=1对所述rel(pi,pj)进行量化,得到两个节目pi和pj之间的关系值。4.根据权利要求3所述的基于节目关系的视频节目的搜索方法,其特征在于,所述的从所述搜索向量中提取出视频节目的相关信息,利用所述相关信息通过设定的关系值计算公式分别计算出所述搜索向量与各个视频节目之间的关系值,包括:从搜索向量中提取出节目的相关信息,对所述相关信息进行结构化处理得到搜索向量的结构化信息,所述结构化处理包括清除停用词,去除非法字符,分词中的至少一项,根据所述搜索向量的结构化信息通过词频-反词频技术建立搜索向量的属性空间;根据搜索向量的属性空间和所述视频数据库中存储的各个视频节目的属性空间,计算出所述搜索向量和所述视频数据库中存储的各个视频节目之间的相同属性之间的相关性值,将多个所述相关性值进行加权求和,将加权求和的结果进行归一化处理,得到所述搜索向量和所述视频数据库中存储的各个视频节目之间的关系值。5.根据权利要求1至4任一项所述的基于节目关系的视频节目的搜索方法,其特征在于,所述的利用所述关系网络对所述初始视频搜索结果进行扩展,得到最终的视频搜索结果,包括:选取所述初始视频搜索结果中的某个视频节目,通过所述关系网络获取和所述某个视频节目之间的关系值大于设定数值的二级视频节目,将该二级视频节目作为上述搜索关键词对应的二级视频搜索结果;或者,从视频数据库中获取所述某个视频节目的属性空间信息,针对所述某个视频节目的特定属性信息对所述初始视频搜索结果进行扩展,根据所述关系网络获取和所述某个视频节目之间特定属性信息对应的相关性值大于设定数值的二级视频节目,将该二级视频节目作为所述搜...

【专利技术属性】
技术研发人员:孙科武于志强舒南飞肖天柱王芳
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1