一种基于用户话题权威性的微博重排序方法技术

技术编号:10973875 阅读:105 留言:0更新日期:2015-01-30 05:47
本发明专利技术涉及一种基于用户话题权威性的微博重排序方法,该方法通过获取用户搜索关键词信息,将用户搜索关键词划分到某个话题,然后对微博搜索引擎按照时间顺序返回来的近几天最新结果,再在该话题上对所有的用户计算话题权威值(表征该用户的话题权威性),根据此话题权威值,再一次对搜索引擎返回的搜索结果进行重排序。本发明专利技术针对微博搜索领域,综合考虑用户话题权威性以及传统的话题权威度量,提出用户话题权威值的计算方法,并使用得到的用户话题权威值对搜索引擎按照时间顺序返回的结果进行调整,其意义在于,该方法能够提高排序后返回结果的质量,从而证明用户话题权威性在微博排序中的有效性,增强用户体验。

【技术实现步骤摘要】

本专利技术涉及一种微博排序方法,特别涉及一种基于用户话题权威性的微博重排序 方法,属于微博搜索

技术介绍
随着计算机技术的不断发展以及人民生活水平的不断提高,互联网越来越普及, 网络资源极大丰富,这给网页搜索以及微博搜索技术提出了极大挑战。对于网页搜索,现有 的比较有代表性的搜索引擎比如谷歌、百度,运用一定的策略搜集互联网上的信息,然后使 用一定的方法根据用户查询关键字将检索到的信息展现给用户,而微博搜索引擎和传统的 网页搜索引擎相似,区别在于检索的信息以及实用的排序机制不同。 现有的技术中,微博搜索引擎所采用的主流技术是:当用户以关键词搜索微博时, 搜索引擎会在数据库中进行查询,如果找到与该用户输入内容相符的微博,便采用一定的 策略,比如说,根据该条微博被转发的次数、发表该微博的用户的权威值,以及该条微博与 其他微博的内容相似度等特征,计算出每一条微博的对应值,并以此值为基础对搜索出来 的微博进行排序,将得到的微博排序结果返回给用户。 但是,上述微博搜索引擎采用的主流排序技术中,在考虑用户权威这个特征时,只 是考虑的用户的比较一般本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201410564145.html" title="一种基于用户话题权威性的微博重排序方法原文来自X技术">基于用户话题权威性的微博重排序方法</a>

【技术保护点】
一种用户话题权威性的计算方法,其特征在于,包括以下步骤:步骤一、获取话题以及由微博搜索引擎返回的按照时间排序的结果集;步骤二、在步骤一得到的结果集中抽取所有用户id;步骤三、获取步骤二中每一个用户id一跳网络中的信息;步骤四、从步骤三得到的结果集中提取步骤一获取的话题上的所有微博及其对应的用户信息;步骤五、从步骤四得到的结果集中提取话题度量;步骤六、提出用户话题权威性的特征、特征计算公式并计算;步骤七、提出用户话题权威性即用户话题权威值计算公式并计算;步骤八、返回用户话题权威值计算结果。

【技术特征摘要】
2014.04.11 CN 201410144185.31. 一种用户话题权威性的计算方法,其特征在于,包括以下步骤: 步骤一、获取话题以及由微博搜索引擎返回的按照时间排序的结果集; 步骤二、在步骤一得到的结果集中抽取所有用户id; 步骤三、获取步骤二中每一个用户id-跳网络中的信息; 步骤四、从步骤三得到的结果集中提取步骤一获取的话题上的所有微博及其对应的用 户信息; 步骤五、从步骤四得到的结果集中提取话题度量; 步骤六、提出用户话题权威性的特征、特征计算公式并计算; 步骤七、提出用户话题权威性即用户话题权威值计算公式并计算; 步骤八、返回用户话题权威值计算结果。2. 根据权利要求1所述的一种用户话题权威性的计算方法,其特征在于,所述获取步 骤二中每一个用户id-跳网络中的信息包括以下内容: 用户id的所有粉丝的id及其所有微博; 用户id所关注的所有人的id及其所有微博; 用户id的所有微博。3. 根据权利要求2所述的一种用户话题权威性的计算方法,其特征在于,所述每一个 用户id的话题度量包括以下内容: 表示原创微博的度量:〇Τ1 (原创微博的数量),0T2 (分享链接的数量)、0T3 (用户所有 微博中的单词的重复度)和〇T4(hashtag的数量); 表示会话微博的度量=CTl(会话微博的数量)和CT2(由该用户发起的会话微博的数 量); 表示转发微博的度量:RT1 (转发微博的数量),RT2 (原创微博中被其他用户转发的个 数(不重复计算))和RT3 (转发该用户的微博的所有用户的个数(不重复计算)); 表示提及的度量:Ml(该用户提及到其他用户的次数(相同用户可重复计算)),M2 (该 用户提及到其他用户的个数(相同用户不重复计算))、M3(其他用户提及到该用户的次数) 和M4(提及到该用户的其他用户的个数); 表示与用户关系图相关的度量:Gl(该用户在该话题上活跃的粉丝数),G2 (该用户关 注的人在该话题上活跃的个数)、G3 (在该用户之后发布该话题微博的粉丝数)和G4 (该用 户关注的人中先于该用户发布该话题微博的数量); 表示用户总的受欢迎程度的度量:Fl(该用户总的粉丝的数量)和F2(该用户关注的 人的总的数量。4. 根据权利要求3所述的一种用户话题...

【专利技术属性】
技术研发人员:礼欣翟艳梅
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1