多指标综合权重音、视频专辑排序系统技术方案

技术编号:4290536 阅读:363 留言:0更新日期:2012-04-11 18:40
多指标综合权重音、视频专辑排序系统,包括音、视频专辑数据库,音、视频专辑分析处理模块,主观权重确定模块,客观权重计算模块,根据所述音、视频专辑分析处理模块提供的数据,计算所述主观权重确定模块所确定的排序指标的客观权重;优化决策模块,用于计算每个排序指标的综合权重,指标排序得分计算模块,用于计算每个音、视频专辑对于指标的排序得分;综合得分计算模块,用于计算该音、视频专辑的加权得分值,本发明专利技术综合考虑了音、视频专辑多项特征以及用户对音、视频专辑的反馈,能够对音、视频专辑进行智能化的灵活排序,以最佳方式将搜索到的音、视频专辑结果返回给用户。

【技术实现步骤摘要】

本专利技术属于音、视频专辑数据处理领域,特别涉及一种音、视频专辑排序系统。
技术介绍
随着互联网的发展,视频的影响力正在逐步增强,互联网上的视频数量也与日倶增。为了便于查找和观看,一些视频网站提供了将多个相关视频制作成一个音、视频专辑的形式的方法,用户只要找到这个音、视频专辑,就可以观看该音、视频专辑中的全部视频,而不需要分别另外查找。但是随着音、视频专辑数量的增加,音、视频专辑名称和标签重复的现象不可避免,因此当某个用户需要查找某个音、视频专辑时,结果中往往出现大量的同名音、视频专辑,让用户无从选择。在传统的视频搜索引擎中,对音、视频专辑的排序仅仅根据文本的相似性进行,将那些描述文本(如音、视频专辑标题,标签等)与查询文本相似的音、视频专辑排在前面返回给用户。这样的排序结果具有以下不足 1、一些用户为了提高自己制作音、视频专辑的搜索排名,可能会填充一些与该音、 视频专辑无关的热门搜索词汇,影响音、视频专辑搜索的准确性和客观性; 2、影响用户搜索体验,降低对网站的满意度和忠诚度; 3、增加用户点击或搜索次数,加重服务器负担。 鉴于此, 一些音、视频专辑网站采用了一些其他排序方式,如按照播放次数排序, 音、视频专辑的播放次数越多,排名越靠前。或者按照上传时间、音、视频专辑时长等要素进 行排序。这些排序方式从本质上来说,都只采用了一个衡量指标,而忽略了音、视频专辑的 其他丰富特性,导致最后搜索排序的结果不能满足用户的真正需求。 因此,目前的排序技术在音、视频专辑搜索的表现形式中过于单一,不能准确反映 音、视频专辑的质量和受欢迎程度,难以满足用户的真正搜索需求。
技术实现思路
为了解决以上问题,本专利技术提供一种多指标综合权重音、视频专辑排序系统,通过 分析音、视频专辑的多重内在指标和用户的反馈信息,构建了一套衡量音、视频专辑质量优 劣的指标体系,利用该指标体系对每个音、视频专辑计算其得分,计算结果作为搜索引擎排 序依据。 为实现上述目的,本专利技术采用如下技术方案 —种多指标综合权重音、视频专辑排序系统,包括 音、视频专辑数据库,用于保存音、视频专辑原始信息; 音、视频专辑分析处理模块,与所述音、视频专辑数据库相连接,用于对所述音、视 频专辑数据库中的音、视频专辑原始信息进行分析和处理; 主观权重确定模块,用于设定排序指标j并给出排序指标j的主观权重; 客观权重计算模块,与所述音、视频专辑分析处理模块和主观权重确定模块相连接,根据所述音、视频专辑分析处理模块提供的数据,计算所述主观权重确定模块所确定的 排序指标j的客观权重; 优化决策模块,与所述客观权重计算模块相连接,用于计算每个排序指标j的综 合权重Wj,其中,5^iWj = l,Wj > o,F(vv) = i:SUi:S^Ui2 + (1 - n)2} 模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重Wj越准 确,更能刻画各指标之间的关系,aj、bj, j = 1、2、…、m分别为指标j的主观和客观权重;0 < P < 1为偏好系数; 指标排序得分计算模块,与所述音、视频专辑分析处理模块相连接,用于计算每个 音、视频专辑i对于指标j的排序得分Zi (j); 综合得分计算模块,与所述优化决策模块和所述指标排序得分计算模块相连接, 用于计算该音、视频专辑的加权得分值fi,其公式为 fi = S^iWj *Zi(j),i = 1、2、…、n。 本专利技术能真实客观反映音、视频专辑的内在特性,真正优秀和受用户欢迎的音、视 频专辑将排名靠前,旨在解决现有音、视频专辑搜索引擎在排序技术上的不足,使最后排序 得分更客观公正。其综合考虑了音、视频专辑多项特征以及用户对音、视频专辑的反馈,能 够对音、视频专辑进行智能化的灵活排序,以最佳方式将搜索到的音、视频专辑结果返回给 用户。 为了使本专利技术的目的、技术方法和优点更清晰明白,下面结合附图,对本专利技术进一 步进行详细解释和说明。附图说明 图1为本专利技术多指标综合权重音、视频专辑排序系统结构示意图。 具体实施例方式如图1所示,一种多指标综合权重音、视频专辑排序系统,其包括 音、视频专辑数据库,用于保存音、视频专辑原始信息,该音、视频专辑原始信息可包括音、视频专辑的播放次数、标题、评论数、更新时间、上传人、原创贡献率、订阅数、浏览数等; 音、视频专辑分析处理模块,与所述音、视频专辑数据库相连接,用于对所述音、视频专辑数据库中的音、视频专辑原始信息进行分析和处理,例如将音、视频专辑内容转化成其它处理模块中需要的格式,同时还可对稀疏数据和噪音数据进行处理; 主观权重确定模块,用来确定多个排序指标j,并对这些排序指标j给出主观权重。该主观权重可通过随机调查用户需求,并征求音、视频专辑业内专家意见,确定多个排序指标j,并给出这些排序指标j主观权重。在本实施例中主要采用了文本匹配程度、日均播放次数、最后更新时间、原创贡献率、订阅数、评论数、均衡度等指标作为排序的排序指标j。其中文本匹配程度这一指标由搜索引擎负责度量,在搜索时与本系统计算的排序得分进行整合。可以理解,上述的几个排序指标j只是用来解释本说明,而不是构成本专利技术对排序5指标j选择范围的限制。 客观权重计算模块,与所述音、视频专辑分析处理模块和主观权重确定模块相连 接,根据所述音、视频专辑分析处理模块提供的数据,计算所述主观权重确定模块所确定的 排序指标j的客观权重。其中所述客观权重可通过熵值法计算得到。熵(entropy)是系统 状态不确定性(混沌态)的度量,可被用来度量排序指标j包含信息量的大小。熵越大,说 明该排序指标j包含的信息越多,该指标对于音、视频专辑的排序效果就越大,即指标传输 的决策信息也就越大,它的权重系数值也就越大。熵值法的优点在于该方法最大程度地利 用了评价方案的目标值或属性值来计算各指标的权重系数,因而是较为客观的权重系数赋 权方法。 熵值法计算公式如下 设各指标的客观权重为bj, j = 1、2、…、m,则m bf(l-hj)/》l-hk)k=l其中,hj = (Inn)-^^pj(i)lnpj(i)为每个指标j的熵;Pj(i) = Zj(i)/SIUZj(i)用来刻画所有音、视频专辑对于指标j的分布;Zj(i)为每个指标的标准化(规范化)得分;且当Pj(i) = 0时,规定Pj(i)l即j(i) = O(i = 1、2、 ...、n;j = l、2、…、m)。 优化决策模块,与所述客观权重计算模块相连接,用于计算每个排序指标j的综合权重Wj。根据客观权重和主观权重,建立数学模型,并计算其最优解,该最优解就是每个排序指标j的综合权重Wj。如果仅仅根据主观权重进行音、视频专辑排序,不能真实准确反映指标的重要程度,往往造成排序结果的不准确。因此为了兼顾主观权重的偏好,又充分利用客观权重带来的客观信息,建立如下优化决策模型 设各项指标的综合权重为Wj,其中,S卩i Wj = 1, Wj > 0,f(w) = i:^E^i(H2 + (1 — n)[(w厂bj)Zi(j)f)( * ) 模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重Wj越准 确,更能刻画各指标之间的关系。其中a本文档来自技高网
...

【技术保护点】
一种多指标综合权重音、视频专辑排序系统,其特征在于包括:音、视频专辑数据库,用于保存音、视频专辑原始信息;音、视频专辑分析处理模块,与所述音、视频专辑数据库相连接,用于对所述音、视频专辑数据库中的音、视频专辑原始信息进行分析和处理;主观权重确定模块,用于设定排序指标j并给出排序指标j的主观权重;客观权重计算模块,与所述音、视频专辑分析处理模块和主观权重确定模块相连接,根据所述音、视频专辑分析处理模块提供的数据,计算所述主观权重确定模块所确定的排序指标j的客观权重;优化决策模块,与所述客观权重计算模块和主观权重确定模块相连接,用于计算每个排序指标j的综合权重w↓[j],其中,∑↓[j=1]↑[m]w↓[j]=1,w↓[j]≥0,F(w)=Σ↓[i=1]↑[n]Σ↓[j=1]↑[m]{μ[(w↓[j]-a↓[j])z↓[i](j)]↑[2]+(1-μ)[(w↓[j]-b↓[j])z↓[i](j)]↑[2]}模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重w↓[j]越准确,更能刻画各指标之间的关系,a↓[j]、b↓[j],j=1、2、…、m分别为指标j的主观和客观权重;0<μ<1为偏好系数;指标排序得分计算模块,与所述音、视频专辑分析处理模块相连接,用于计算每个音、视频专辑i对于指标j的排序得分z↓[i](j);综合得分计算模块,与所述优化决策模块和所述指标排序得分计算模块相连接,用于计算该音、视频专辑的加权得分值f↓[i],其公式为:f↓[i]=Σ↓[j=1]↑[m]w↓[j]*z↓[i](j),i=1、2、...、n。...

【技术特征摘要】

【专利技术属性】
技术研发人员:谭明杨杰
申请(专利权)人:未序网络科技上海有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1