多媒体标题显示方法及装置制造方法及图纸

技术编号:13390505 阅读:88 留言:0更新日期:2016-07-22 14:02
本发明专利技术提供一种多媒体标题显示方法及装置,其中,该方法包括:对多媒体标题数据集中所包括的各样本标题进行分词处理,以得到多个词语;根据所得到的多个词语建立统计模型;根据所建立的统计模型来计算与所得到的各个词语分别相对应的词间关联权重和词间关联度因素;根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度;以及根据所述词间关联度对所述多媒体标题数据集中的各所述样本标题进行缩略显示。通过本发明专利技术实施例的多媒体标题显示方法及装置,在不改变标题的前提下,明确了标题的核心主题和要显示的内容,解决了用户对长视频标题的主题定位,提升了信息获取效率和用户体验。

【技术实现步骤摘要】
多媒体标题显示方法及装置
本专利技术涉及多媒体处理领域,尤其涉及一种多媒体标题显示方法及装置。
技术介绍
由于用户多媒体数据、例如用户视频数据的标题编写是不完全可控行为,因此会出现字符较多的标题。这些标题在不同设备中显示的效果也有差别,不同终端设备的屏幕可显示的字符长短不一,对于字符较多的标题,有些屏幕无法全部显示,这样会影响信息显示的完整性,从而降低用户对视频主题的理解。同时,在例如视频数据聚合等应用中,会存在长短差别大且不同序列的标题在同一个页面显示,这种显示会造成视觉上的突兀,页面显得零乱而不美观,降低用户浏览体验。因此,需要根据终端设备统一视频标题的布局样式,提升用户体验和获取视频主题的效率。在现有技术中,解决多媒体过长标题显示已有多种方案:方案一,在标题长度超出限定范围时,对该标题从左到右进行截取,并将超出部分用省略号替换;方案二,在标题长度超出限定范围时,保留标题中含有搜索关键词前后的字符,并将左右超出部分用省略号替换;方案三,根据专利文献1即、中国专利公开号CN1860454A使用的方法,为标题提供一个字符较短的第二标题,根据可容纳字符长度而选择使用该第二标题;方案四,根据专利文献2、即中国专利公开号CN104008115A使用的方法,为wap页面中不在设备屏幕内的标题,提供预设浮动标题栏,这样标题就可以通过窗口浮动来进行完整显示。通过以上这些技术,基本可以解决一般的过长字符标题的显示问题,但对于诸如用户视频聚合数据等应用中,则无法达到好的效果。例如,在用户视频聚合数据中,有些视频标题是一个系列,有些视频标题是关键词的堆砌,整个系列的视频标题除编号或主题外几乎一致。因而,如果仅缩略超出屏幕的字符,用户阅览视频标题时会造成所有视频都一样的错觉,无法准确体现视频标题主题,从而无法分辨各个视频主题,影响用户对视频的选择,更使得用户无法直接观看,影响用户体验。另外,对于生成包括第二标题的多个标题而言,其对存储是一种浪费,在视频标题数量大时更难以承受,并且多种终端的屏幕可容纳字符数量不一,可能需要生成多种标题去适应。另外,浮动框的使用会延长用户对每一个长标题的等待,而且需要一直盯着屏幕才能获取视频主题信息,这样会延长用户确定视频标题主题的时间,影响用户获取主题信息的效率,这在一定程度上降低了用户体验。
技术实现思路
技术问题有鉴于此,本专利技术要解决的技术问题是,如何对多媒体标题、特别是长标题进行恰当地显示,以提升用户体验。解决方案为了解决上述技术问题,根据本专利技术的一实施例,提供了一种多媒体标题显示方法,包括:对多媒体标题数据集中所包括的各样本标题进行分词处理,以得到多个词语;根据所得到的多个词语建立统计模型;根据所建立的统计模型来计算与所得到的各个词语分别相对应的词间关联权重和词间关联度因素;根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度;以及根据所述词间关联度对所述多媒体标题数据集中的各所述样本标题进行缩略显示。对于上述多媒体标题显示方法,在一种可能的实现方式中,根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度,包括:根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重;根据所述词间关联权重和所述词权重来确定与所得到的各个词语相对应的词间关联度。对于上述多媒体标题显示方法,在一种可能的实现方式中,根据所述词间关联权重和所述词权重来确定与所得到的各个词语相对应的词间关联度,包括:采用下式1,来计算所述词间关联度,式1,其中,Co(x,y)表示词语x和词语y之间的词间关联度,X(x,y)表示词语x和词语y之间的词间关联权重,w(x)、w(y)、w(xy)分别表示与词语x、y、xy相对应的词权重。对于上述多媒体标题显示方法,在一种可能的实现方式中,所述词间关联度因素包括词频和文档反转频率,根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:采用下式2,根据所述词频和所述文档反转频率来计算与所得到的各个词语相对应的词权重,式2,其中,TF(x)、TF(y)、TF(xy)分别表示与词语x、y、xy相对应的词频,IDF(x)、IDF(y)、IDF(xy)分别表示与词语x、y、xy相对应的文档反转频率。对于上述多媒体标题显示方法,在一种可能的实现方式中,所述词间关联度因素包括词频、文档反转频率和词活跃度,根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:采用下式3,根据所述词频、所述文档反转频率和所述词活跃度来计算与所得到的各个词语相对应的词权重,式3,其中,TF(x)、TF(y)、TF(xy)分别表示与词语x、y、xy相对应的词频,IDF(x)、IDF(y)、IDF(xy)分别表示与词语x、y、xy相对应的文档反转频率,H(x)、H(y)、H(xy)分别表示与词语x、y、xy相对应的词活跃度。对于上述多媒体标题显示方法,在一种可能的实现方式中,所述词间关联度因素包括词频、文档反转频率和词性权重,根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:采用下式4,根据所述词频、所述文档反转频率和所述词性权重来计算与所得到的各个词语相对应的词权重,式4,其中,TF(x)、TF(y)、TF(xy)分别表示与词语x、y、xy相对应的词频,IDF(x)、IDF(y)、IDF(xy)分别表示与词语x、y、xy相对应的文档反转频率,TN(x)、TN(y)、TN(xy)分别表示与词语x、y、xy相对应的词性权重,α表示词性权重参数,用于加降词性权重。对于上述多媒体标题显示方法,在一种可能的实现方式中,所述词间关联度因素包括词频、文档反转频率、词活跃度和词性权重,根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:采用下式5,根据所述词频、所述文档反转频率、所述词活跃度和所述词性权重来计算与所得到的各个词语相对应的词权重,式5,其中,TF(x)、TF(y)、TF(xy)分别表示与词语x、y、xy相对应的词频,IDF(x)、IDF(y)、IDF(xy)分别表示与词语x、y、xy相对应的文档反转频率,H(x)、H(y)、H(xy)分别表示与词语x、y、xy相对应的词活跃度,TN(x)、TN(y)、TN(xy)分别表示与词语x、y、xy相对应的词性权重,α表示词性权重参数,用于加降词性权重。对于上述多媒体标题显示方法,在一种可能的实现方式中,所述多媒体标题显示方法还包括:根据所述词间关联度对所述多媒体标题数据集之外的其它多媒体标题进行缩略显示。对于上述多媒体标题显示方法,在一种可能的实现方式中,在进行分词处理之前,所述多媒体标题显示方法还包括对各所述样本标题进行预处理,具体包括:对各所述样本标题进行规范化处理;以及对进行规范化处理后的各所述本文档来自技高网
...

【技术保护点】
一种多媒体标题显示方法,其特征在于,包括:对多媒体标题数据集中所包括的各样本标题进行分词处理,以得到多个词语;根据所得到的多个词语建立统计模型;根据所建立的统计模型来计算与所得到的各个词语分别相对应的词间关联权重和词间关联度因素;根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度;以及根据所述词间关联度对所述多媒体标题数据集中的各所述样本标题进行缩略显示。

【技术特征摘要】
1.一种多媒体标题显示方法,其特征在于,包括:
对多媒体标题数据集中所包括的各样本标题进行分词处理,以得到多个词语;
根据所得到的多个词语建立统计模型;
根据所建立的统计模型来计算与所得到的各个词语分别相对应的词间关联权重和词间关联度因素;
根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度;以及
根据所述词间关联度对所述多媒体标题数据集中的各所述样本标题进行缩略显示,以使缩略显示后的标题长度适应终端设备的屏幕,其中,缩略显示后的标题长度小于所述样本标题的原长度;
其中,根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度,包括:
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重;
根据所述词间关联权重和所述词权重来确定与所得到的各个词语相对应的词间关联度。


2.根据权利要求1所述的多媒体标题显示方法,其特征在于,根据所述词间关联权重和所述词权重来确定与所得到的各个词语相对应的词间关联度,包括:
采用下式1,来计算所述词间关联度,

式1,
其中,表示词语x和词语y之间的词间关联度,表示词语x和词语y之间的词间关联权重,分别表示与词语x、y、xy相对应的词权重。


3.根据权利要求2所述的多媒体标题显示方法,其特征在于,所述词间关联度因素包括词频和文档反转频率,
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:
采用下式2,根据所述词频和所述文档反转频率来计算与所得到的各个词语相对应的词权重,

式2,
其中,分别表示与词语x、y、xy相对应的词频,分别表示与词语x、y、xy相对应的文档反转频率。


4.根据权利要求2所述的多媒体标题显示方法,其特征在于,所述词间关联度因素包括词频、文档反转频率和词活跃度,
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:
采用下式3,根据所述词频、所述文档反转频率和所述词活跃度来计算与所得到的各个词语相对应的词权重,

式3,
其中,分别表示与词语x、y、xy相对应的词频,分别表示与词语x、y、xy相对应的文档反转频率,分别表示与词语x、y、xy相对应的词活跃度。


5.根据权利要求2所述的多媒体标题显示方法,其特征在于,所述词间关联度因素包括词频、文档反转频率和词性权重,
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:
采用下式4,根据所述词频、所述文档反转频率和所述词性权重来计算与所得到的各个词语相对应的词权重,

式4,
其中,分别表示与词语x、y、xy相对应的词频,分别表示与词语x、y、xy相对应的文档反转频率,分别表示与词语x、y、xy相对应的词性权重,表示词性权重参数,用于加降词性权重。


6.根据权利要求2所述的多媒体标题显示方法,其特征在于,所述词间关联度因素包括词频、文档反转频率、词活跃度和词性权重,
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:
采用下式5,根据所述词频、所述文档反转频率、所述词活跃度和所述词性权重来计算与所得到的各个词语相对应的词权重,

式5,
其中,分别表示与词语x、y、xy相对应的词频,分别表示与词语x、y、xy相对应的文档反转频率,分别表示与词语x、y、xy相对应的词活跃度,分别表示与词语x、y、xy相对应的词性权重,表示词性权重参数,用于加降词性权重。


7.根据权利要求1-6中任一项所述的多媒体标题显示方法,其特征在于,所述多媒体标题显示方法还包括:
根据所述词间关联度对所述多媒体标题数据集之外的其它多媒体标题进行缩略显示。


8.根据权利要求1-6中任一项所述的多媒体标题显示方法,其特征在于,在进行分词处理之前,所述多媒体标题显示方法还包括对各所述样本标题进行预处理,具体包括:
对各所述样本标题进行规范化处理;以及
对进行规范化处理后的各所述样本标题进行清洗。


9.根据权利要求1-6中任一项所述的多媒体标题显示方法,其特征在于,根据所述词间关联度对所述多媒体标题数据集中的各所述样本标题进行缩...

【专利技术属性】
技术研发人员:甘润生刘云剑王旭尹玉宗姚键潘柏宇王冀
申请(专利权)人:合一网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1