多指标综合权重音、视频专辑排序方法技术

技术编号:4290537 阅读:341 留言:0更新日期:2012-04-11 18:40
一种多指标综合权重音、视频专辑排序方法,包括:音、视频专辑数据库,音、视频专辑分析处理步骤,主观权重确定步骤,客观权重计算步骤,根据所述音、视频专辑分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标的客观权重;优化决策步骤,用于计算每个排序指标的综合权重,指标排序得分计算步骤,用于计算每个音、视频专辑对于指标的排序得分;综合得分计算步骤,用于计算该音、视频专辑的加权得分值,本发明专利技术综合考虑了音、视频专辑多项特征以及用户对音、视频专辑的反馈,能够对音、视频专辑进行智能化的灵活排序,以最佳方式将搜索到的音、视频专辑结果返回给用户。

【技术实现步骤摘要】

本专利技术属于音、视频专辑数据处理领域,特别涉及一种音、视频专辑排序系统。
技术介绍
随着互联网的发展,视频的影响力正在逐步增强,互联网上的视频数量也与日倶增。为了便于查找和观看,一些视频网站提供了将多个相关视频制作成一个音、视频专辑的形式的方法,用户只要找到这个音、视频专辑,就可以观看该音、视频专辑中的全部视频,而不需要分别另外查找。但是随着音、视频专辑数量的增加,音、视频专辑名称和标签重复的现象不可避免,因此当某个用户需要查找某个音、视频专辑时,结果中往往出现大量的同名音、视频专辑,让用户无从选择。在传统的视频搜索引擎中,对音、视频专辑的排序仅仅根据文本的相似性进行,将那些描述文本(如音、视频专辑标题,标签等)与查询文本相似的音、视频专辑排在前面返回给用户。这样的排序结果具有以下不足 1、一些用户为了提高自己制作音、视频专辑的搜索排名,可能会填充一些与该音、视频专辑无关的热门搜索词汇,影响音、视频专辑搜索的准确性和客观性; 2、影响用户搜索体验,降低对网站的满意度和忠诚度; 3、增加用户点击或搜索次数,加重服务器负担。 鉴于此, 一些音、视频专辑网站采用了一些其他排序方式,如按照播放次数排序,音、视频专辑的播放次数越多,排名越靠前。或者按照上传时间、音、视频专辑时长等要素进行排序。这些排序方式从本质上来说,都只采用了一个衡量指标,而忽略了音、视频专辑的其他丰富特性,导致最后搜索排序的结果不能满足用户的真正需求。 因此,目前的排序技术在音、视频专辑搜索的表现形式中过于单一,不能准确反映音、视频专辑的质量和受欢迎程度,难以满足用户的真正搜索需求。专利技术内容 为了解决以上问题,本专利技术提供一种,通过分析音、视频专辑的多重内在指标和用户的反馈信息,构建了一套衡量音、视频专辑质量优劣的指标体系,利用该指标体系对每个音、视频专辑计算其得分,计算结果作为搜索引擎排序依据。 为实现上述目的,本专利技术采用如下技术方案 —种,包括 音、视频专辑数据库,用于保存音、视频专辑原始信息; 音、视频专辑分析处理步骤,用于对所述音、视频专辑数据库中的音、视频专辑原始信息进行分析和处理; 主观权重确定步骤,用于设定排序指标j并给出排序指标j的主观权重; 客观权重计算步骤,根据所述音、视频专辑分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标j的客观权重; 优化决策步骤,用于计算每个排序指标j的综合权重Wj,其中,Sj^ Wj = 1, w' 2 0 ,<formula>formula see original document page 6</formula> 模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重Wj越准确,更能刻画各指标之间的关系,aj、bj, j = 1、2.....m分别为指标j的主观和客观权重;0 < ii < 1为偏好系数; 指标排序得分计算步骤,用于计算每个音、视频专辑i对于指标j的排序得分Zi(j); 综合得分计算步骤,用于计算该音、视频专辑的加权得分值fi,其公式为 <formula>formula see original document page 6</formula> 本专利技术能真实客观反映音、视频专辑的内在特性,真正优秀和受用户欢迎的音、视频专辑将排名靠前,旨在解决现有音、视频专辑搜索引擎在排序技术上的不足,使最后排序得分更客观公正。其综合考虑了音、视频专辑多项特征以及用户对音、视频专辑的反馈,能够对音、视频专辑进行智能化的灵活排序,以最佳方式将搜索到的音、视频专辑结果返回给用户。 为了使本专利技术的目的、技术方法和优点更清晰明白,下面结合附图,对本专利技术进一步进行详细解释和说明。附图说明 图1为本专利技术流程图。具体实施例方式如图1所示,一种,其包括 音、视频专辑数据库,用于保存音、视频专辑原始信息,该音、视频专辑原始信息可包括音、视频专辑的播放次数、标题、评论数、更新时间、上传人、评论数、订阅数等; 音、视频专辑分析处理步骤,用于对所述音、视频专辑数据库中的音、视频专辑原始信息进行分析和处理,例如将音、视频专辑内容转化成其它处理步骤中需要的格式,同时还可对稀疏数据和噪音数据进行处理;0028] 主观权重确定步骤,用来确定多个排序指标j,并对这些排序指标j给出主观权重。该主观权重可通过随机调查用户需求,并征求音、视频专辑业内专家意见,确定多个排序指标j,并给出这些排序指标j主观权重。在本实施例中主要采用了文本匹配程度、日均播放次数、更新时间、原创贡献率、订阅数、评论数和均衡度等指标作为排序的评价指标j。其中文本匹配程度这一指标由搜索引擎负责度量,在搜索时与本系统计算的排序得分进行整合。可以理解,上述的几个排序指标j只是用来解释本说明,而不是构成本专利技术对排序指标j选择范围的限制。 客观权重计算步骤,根据所述音、视频专辑分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标j的客观权重。其中所述客观权重可通过熵值法计算得到。熵(entropy)是系统状态不确定性(混沌态)的度量,可被用来度量排序指标j包含 信息量的大小。熵越大,说明该排序指标j包含的信息越多,该指标对于音、视频专辑的排 序效果就越大,即指标传输的决策信息也就越大,它的权重系数值也就越大。熵值法的优点 在于该方法最大程度地利用了评价方案的目标值或属性值来计算各指标的权重系数,因而 是较为客观的权重系数赋权方法。 熵值法计算公式如下 设各指标的客观权重为bj, j = 1、2.....m,则m <formula>formula see original document page 7</formula>其中,hj = (lnn"ZlUPj(i)lnpj(0为每个指标j的熵;Pj(O = Zj(i)/SjliZj(i)用来刻画所有音、视频专辑对于指标j的分布;Zj(i)为每个指标的标准化(规范化)得分;且当p"i) = 0时,规定Pj(i)l即j(i) = O(i = 1、2.....n ;j = 1、2.....m)。 优化决策步骤,与所述客观权重计算步骤相连接,用于计算每个排序指标j的综 合权重Wj。根据客观权重和主观权重,建立数学模型,并计算其最优解,该最优解就是每个 排序指标j的综合权重Wj。如果仅仅根据主观权重进行音、视频专辑排序,不能真实准确反 映指标的重要程度,往往造成排序结果的不准确。因此为了兼顾主观权重的偏好,又充分利 用客观权重带来的客观信息,建立如下优化决策模型 设各项指标的综合权重为Wj,其中,Z^Wj = 1, Wj 2 0 , F(W) = EJUZS^WKwj -)Zi(j)]2 + (1 - H)2) ( * ) 模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重Wj越准确,更能刻画各指标之间的关系。其中aj、bj, j = 1、2.....m分别为指标j的主观和客观权重。0< < 1为偏好系数,反映分析者对主观权重和客观权重的偏好程度,这里取P =0. 5。 通过证明知,当综合权重Wi = iiai+(l-ii)bi, i = 本文档来自技高网...

【技术保护点】
一种多指标综合权重音、视频专辑排序方法,其特征在于包括以下步骤:1)音、视频专辑分析处理步骤,用于对所述音、视频专辑数据库中的音、视频专辑原始信息进行分析和处理;2)主观权重确定步骤,用于设定排序指标j并给出排序指标j的主观权重;3)客观权重计算步骤,根据所述音、视频专辑分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标j的客观权重;4)优化决策步骤,用于计算每个排序指标j的综合权重w↓[j],其中,∑↓[j=1]↑[m]w↓[j]=1,w↓[j]≥0,F(w)=Σ↓[i=1]↑[n]Σ↓[j=1]↑[m]{μ[(w↓[j]-a↓[j])z↓[i](j)]↑[2]+(1-μ)[(w↓[j]-b↓[j])z↓[i](j)]↑[2]}模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重w↓[j]越准确,更能刻画各指标之间的关系,a↓[j]、b↓[j],j=1、2、…、m分别为指标j的主观和客观权重;0<μ<1为偏好系数;5)指标排序得分计算步骤,用于计算每个音、视频专辑i对于指标j的排序得分z↓[i](j);6)综合得分计算步骤,用于计算该音、视频专辑的加权得分值f↓[i],其公式为:f↓[i]=Σ↓[j=1]↑[m]w↓[j]*z↓[i](j),i=1,2,...,n。...

【技术特征摘要】

【专利技术属性】
技术研发人员:谭明杨杰
申请(专利权)人:未序网络科技上海有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1