一种社会化的搜索引擎方法和系统技术方案

技术编号:8323592 阅读:249 留言:0更新日期:2013-02-14 01:38
一种社会化的搜索引擎方法,首先基于微博,抽取微博用户的基本信息,建立专家信息库,然后获取用户查询请求,根据查询请求在专家信息库中找到与之相关的专家,接着依据用户自主选择,将用户的查询请求转发给一个或多个被选专家,进而,在用户请求转发后,对此请求进行实时追踪,及时抓取专家返回的结果,最后对查询结果进行处理,并返回给用户。此方法更多的考虑了人的因素,通过帮助用户找到与查询最为相关的专家,在充分发挥用户主观判断能力下,实现人到人的信息获取模式,从而提高搜索引擎的查全率和查准率。

【技术实现步骤摘要】

本专利技术涉及互联网信息处理领域中的搜索引擎技术,具体为一种社会化的搜索引擎方法和系统
技术介绍
搜索引擎作为互联网信息检索的重要工具,极大地节省了用户获取信息的时间和精力。然而,随着网络的普及,存在于网络资源池中的数据呈指数型增长,搜索引擎已经越来越难以满足用户的搜索需求。特别是Web2. O的出现与发展,更多地考虑了人的因素,充分发挥了人的互动性,更促使互联网成为了一个人们可以将自己隐性知识转化流通、可共享显性知识的互动平台。因而,互联网中的信息资源也不再仅仅依靠网站管理人员建立和维护,普通用户成为信息的缔造者和使用者,改变了以往用户信息获取的推送模式,呈现出去中心化的含义。目前,随着社交网站、个人主页、博客、微博、视频和图片分享等网络应用的快速发展,极大地体现了人们对互动性的渴求。特别是微博的兴起,以一条简短的状态信息来反映用户自身最新的状况,改变了长久以来始终以网页作为信息获取基本单元的模式,用户希望通过参与、交流,获取个性化、可信任的信息。然而这种对互动性的诉求是目前搜索引擎通过在搜索框中键入关键字进行匹配所难以满足的。同时,在互联网海量信息面前,以Google、百度为代表的机器搜索依然强调算法,试图用不断提高的机器性能和不断改进的算法技术来提升用户的搜索体验,已渐渐显得力不从心,无论是精准度还是效率都不能满足人的需要。近年来,百度贴吧、搜狗爱问等问答系统的出现虽然在一定程度上满足了人们对互动性的要求,但是由于其答题者常常未经筛选,也未能发挥提问者的主观判断性,往往导致大量垃圾信息的出现。
技术实现思路
针对以上问题,本专利技术基于微博平台,提供了一种社会化的搜索引擎方法,来帮助用户获取准确、可信任的信息,从而提高搜索引擎的查全率和查准率。为了达到上述目的,本专利技术采用了以下技术方案一种社会化的搜索引擎方法,包括以下步骤( I)基于微博,建立专家信息库;(2)获取用户查询请求,根据查询请求在专家信息库中找到与之相关的专家;(3)将用户的查询请求发送给一个或多个专家;(4)用户请求转发后,对此请求进行实时追踪,及时抓取专家返回的结果;(5)对步骤(4)中返回的结果进行处理,并返回给用户。所述的搜索引擎方法,其特征是,所述步骤(I)包括以下步骤(I. I)爬取微博网站上的网页,抽取其中微博用户的基本信息;(I. 2)提取微博用户的微博关键词;(1.3)计算微博用户的综合影响力。所述的搜索引擎方法,其特征是,步骤(I. I)所述微博用户的基本信息包括微博用户名、微博账号、所在地、联系邮箱、用户标签、用户简介、关注数、粉丝数、微博数。所述的搜索引擎方法,其特征是,步骤(I. 2)中,若用户标签不为空,则将其作为该用户的微博关键词;否则,将从该用户最新发表的M篇微博状态中提取关键词作为该用户的微博关键词,其中M为自定义值。所述的搜索引擎方法,其特征是,步骤(I. 3),即利用公式(I)计算微博用户的综合影响力Wu ^dlNfans+S2CPiNmm+^2Nsutai)(I)本文档来自技高网...

【技术保护点】
一种社会化的搜索引擎方法,包括以下步骤:(1)基于微博,建立专家信息库;(2)获取用户查询请求,根据查询请求在专家信息库中找到与之相关的专家;(3)将用户的查询请求发送给一个或多个专家;(4)用户请求转发后,对此请求进行实时追踪,及时抓取专家返回的结果;(5)对步骤(4)中返回的结果进行处理,并返回给用户。

【技术特征摘要】
1.一种社会化的搜索引擎方法,包括以下步骤 (1)基于微博,建立专家信息库; (2)获取用户查询请求,根据查询请求在专家信息库中找到与之相关的专家; (3)将用户的查询请求发送给一个或多个专家; (4)用户请求转发后,对此请求进行实时追踪,及时抓取专家返回的结果; (5)对步骤(4)中返回的结果进行处理,并返回给用户。2.如权利要求I所述的搜索引擎方法,其特征是,所述步骤(I)包括以下步骤 (I. I)爬取微博网站上的网页,抽取其中微博用户的基本信息; (I. 2)提取微博用户的微博关键词; (I. 3)计算微博用户的综合影响力。3.如权利要求2所述的搜索引擎方法,其特征是,步骤(I.I)所述微博用户的基本信息包括微博用户名、微博账号、所在地、联系邮箱、用户标签、用户简介、关注数、粉丝数、微博数。4.如权利要求3所述的搜索引擎方法,其特征是,步骤(I.2)中,若用户标签不为空,则将其作为该用户的微博关键词;否则,将从该用户最新发表的M篇微博状态中提取关键词作为该用户的微博关键词,其中M为自定义值。5.如权利要求2所述的搜索引擎方法,其特征是,步骤(I.3),即利用公式(I)计算微博用户的综合影响力 K+S2Cp1^tten+P2^statlls)(I) —W户粉丝数α) 1 —专家库中用户粉丝数最大值Ν =用户关注数(ffl) —专家库中用户关注数最大值Ar —用户微博数,、α —专家库中用户微博数最大值' 其中Wu表示微博用户u的综合影响力,Nfans、Nattra^P Nstatus分别表示微博用户u的粉丝数占有率、关注数占有率和微博数占有率,4、β i为权重因子。6....

【专利技术属性】
技术研发人员:王恺莫倩张树张传文李阳
申请(专利权)人:北京网智天元科技有限公司北京工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1