多指标综合权重视频排序方法技术

技术编号:4290535 阅读:432 留言:1更新日期:2012-04-11 18:40
一种多指标综合权重视频排序方法,包括:视频数据库,视频分析处理步骤,主观权重确定步骤,客观权重计算步骤,根据所述视频分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标的客观权重;优化决策步骤,用于计算每个排序指标的综合权重,指标排序得分计算步骤,用于计算每个视频对于指标的排序得分;综合得分计算步骤,用于计算该视频的加权得分值,本发明专利技术综合考虑了视频多项特征以及用户对视频的反馈,能够对视频进行智能化的灵活排序,以最佳方式将搜索到的视频结果返回给用户。

【技术实现步骤摘要】

本专利技术属于视频数据处理领域,特别涉及一种视频排序系统。
技术介绍
随着互联网的发展,视频的影响力正在逐步增强,互联网上的视频数量也与日倶 增。在海量的视频中,要找到用户需要的某个视频,传统的搜索引擎仅仅根据文本的相似性 对视频进行排序,将那些视频描述文本(如视频标题,标签等)与查询文本相似的视频排在 前面返回给用户。这样的排序结果具有以下三个缺点 1.导致作弊现象比较严重,影响视频搜索的准确性和客观性; 2.影响用户搜索体验,降低对网站的满意度和忠诚度; 3.增加用户点击或搜索次数,加重服务器负担。 鉴于此, 一些视频网站采用了一些其他排序方式,如按照播放次数排序,视频的播 放次数越多,排名越靠前。或者按照上传时间、视频时长等要素进行排序。这些排序方式从 本质上来说,都只采用了一个衡量指标,而忽略了视频的其他丰富特性,导致最后搜索排序 的结果不能满足用户的真正需求。 因此,目前的排序技术在视频搜索的表现形式中过于单一,不能准确反映视频的 质量和受欢迎程度,难以满足用户的真正搜索需求。
技术实现思路
为了解决以上问题,本专利技术提供一种,通过分析视频的多重内在指标和用户的反馈信息,构建了一套衡量视频质量优劣的指标体系,利用该指标体系对每个视频计算其得分,计算结果作为搜索引擎排序依据。 为实现上述目的,本专利技术采用如下技术方案 —种,包括 视频数据库,用于保存视频原始信息; 视频分析处理步骤,用于对所述视频数据库中的视频原始信息进行分析和处理; 主观权重确定步骤,用于设定排序指标j并给出排序指标j的主观权重; 客观权重计算步骤,根据所述视频分析处理步骤提供的数据,计算所述主观权重 确定步骤所确定的排序指标j的客观权重; 优化决策步骤,用于计算每个排序指标j的综合权重Wj,其中, J]j^Wj = l,Wj > 0,F(w) = i:SUSj^(H2 + (1 - H)2) 模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重Wj越准确,更能刻画各指标之间的关系,aj、bj, j = 1、2.....m分别为指标j的主观和客观权重;0 < ii < 1为偏好系数; 指标排序得分计算步骤,用于计算每个视频i对于指标j的排序得分Zi(j); 综合得分计算步骤,用于计算该视频的加权得分值fi,其公式为 <formula>formula see original document page 6</formula> 本专利技术能真实客观反映视频的内在特性,真正优秀和受用户欢迎的视频将排名靠 前,旨在解决现有视频搜索引擎在排序技术上的不足,使最后排序得分更客观公正。其综合 考虑了视频多项特征以及用户对视频的反馈,能够对视频进行智能化的灵活排序,以最佳 方式将搜索到的视频结果返回给用户。 为了使本专利技术的目的、技术方法和优点更清晰明白,下面结合附图,对本专利技术进一 步进行详细解释和说明。附图说明 图1为本专利技术流程图。 具体实施例方式如图1所示,一种,其包括 视频数据库,用于保存视频原始信息,该视频原始信息可包括视频的播放次数、标 题、评论数、上传时间、上传人、被专辑收录次数、均衡度等; 视频分析处理步骤,用于对所述视频数据库中的视频原始信息进行分析和处理, 例如将视频内容转化成其它处理步骤中需要的格式,同时还可对稀疏数据和噪音数据进行 处理; 主观权重确定步骤,用来确定多个排序指标j,并对这些排序指标j给出主观权 重。该主观权重可通过随机调查用户需求,并征求视频业内专家意见,确定多个排序指标 j,并给出这些排序指标j主观权重。在本实施例中主要采用了文本匹配程度、日均播放次 数、上传时间、被专辑收录次数、上传人重要程度、均衡度等指标作为排序的排序指标j。其 中文本匹配程度这一指标由搜索引擎负责度量,在搜索时与本系统计算的排序得分进行整 合。可以理解,上述的几个排序指标j只是用来解释本说明,而不是构成本专利技术对排序指标 j选择范围的限制。 客观权重计算步骤,根据所述视频分析处理步骤提供的数据,计算所述主观权重 确定步骤所确定的排序指标j的客观权重。其中所述客观权重可通过熵值法计算得到。熵 (entropy)是系统状态不确定性(混沌态)的度量,可被用来度量排序指标j包含信息量的 大小。熵越大,说明该排序指标j包含的信息越多,该指标对于视频的排序效果就越大,即 指标传输的决策信息也就越大,它的权重系数值也就越大。熵值法的优点在于该方法最大 程度地利用了评价方案的目标值或属性值来计算各指标的权重系数,因而是较为客观的权 重系数赋权方法。 熵值法计算公式如下 设各指标的客观权重为bj, j = 1、2.....m,则m<formula>formula see original document page 6</formula>其中,hj = (lnn)-^!UPj(i)lnpj(i)为每个指标j的熵;Pj(i) = Zj(i)/SJUzj(i)用来刻画所有视频对于指标j的分布;Zj(i)为每个指标的标准化(规范化)得分;且当Pj(i) =0时,规定Pj(i)l即j(i) = O(i = 1、2.....n ;j = 1、2.....m)。 优化决策步骤,与所述客观权重计算步骤相连接,用于计算每个排序指标j的综 合权重Wj。根据客观权重和主观权重,建立数学模型,并计算其最优解,该最优解就是每个 排序指标j的综合权重Wj。如果仅仅根据主观权重进行视频排序,不能真实准确反映指标 的重要程度,往往造成排序结果的不准确。因此为了兼顾主观权重的偏好,又充分利用客观 权重带来的客观信息,建立如下优化决策模型 设各项指标的综合权重为Wj,其中,5^iWj = l,Wj 2 0 ,F(w) = ZC^S^0i2 + (1 — H)[(w厂bi)Zi(j)〗2}( * ) 模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重Wj越准确,更能刻画各指标之间的关系。其中aj、bj, j = 1、2.....m分别为指标j的主观和客观权重。0< < 1为偏好系数,反映分析者对主观权重和客观权重的偏好程度,这里取P =0. 5。 通过证明知,当综合权重Wi = iiai+(l-ii)bi, i = 1、2.....m时,模型F(w)得到唯一最优解,即取得最小值。 指标排序得分计算步骤,用来计算每个视频i对于指标j的排序得分Zi (j)。本发 明中采用的排序指标j有日平均播放次数、上传时间、视频节目拥有人上传视频数量、被专 辑收录数、被挖(支持)数、被收藏数、均衡度,其指标j分别记为1、2、3、4、5、6、7。下面就 排序得分Zi(j)的具体计算方法加以说明。 日平均播放次数得分Zi (1):腿M(NP(i)) Zj(l)=最大值 MAX(NORM(NP(i)))i=123..其中,NP(i)为第i个视频的日均播放数;MAX((xl)(下同)用来计算集合{x}WUKIVHXJ — U00 + LOG2(x —99) x>100.的为数学变换函数,对数据: 上传时间得分Zi(2):z说=0.7 + 0.6 +0,本文档来自技高网...

【技术保护点】
一种多指标综合权重视频排序方法,其特征在于包括以下步骤:1)视频分析处理步骤,用于对所述视频数据库中的视频原始信息进行分析和处理;2)主观权重确定步骤,用于设定排序指标j并给出排序指标j的主观权重;3)客观权重计算步骤,根据所述视频分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标j的客观权重;4)优化决策步骤,用于计算每个排序指标j的综合权重w↓[j],其中,∑↓[j=1]↑[m]w↓[j]≥0,F(w)=Σ↓[i=1]↑[n]Σ↓[j=1]↑[m]{μ[(w↓[j]-a↓[j])z↓[j](j)]↑[2]+(1-μ)[(w↓[j]-b↓[j])z↓[j](j)]↑[2]}模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重w↓[j]越准确,更能刻画各指标之间的关系,a↓[j]、b↓[j],j=1、2、…、m分别为指标j的主观和客观权重;0<μ<1为偏好系数;5)指标排序得分计算步骤,用于计算每个视频i对于指标j的排序得分z↓[i](j);6)综合得分计算步骤,用于计算该视频的加权得分值f↓[i],其公式为:f↓[i]=Σ↓[j=1]↑[m]w↓[j]*z↓[i](j),i=1,2,…,n。...

【技术特征摘要】

【专利技术属性】
技术研发人员:谭明杨杰
申请(专利权)人:未序网络科技上海有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有1条评论
  • 来自[北京市电信互联网数据中心] 2015年01月22日 19:49
    动词,认为很重要而认真对待的意思。
    0
1