搜索系统及方法技术方案

技术编号:9839993 阅读:97 留言:0更新日期:2014-04-02 03:16
本发明专利技术提供一种搜索方法,包括:接收第一使用者透过一个终端设备输入的第一关键字;从根据所述第一关键字返回的网页中选择R个相关关键字;从曾经使用过所述第一关键字进行网页搜索的其他使用者中选择一个或者多个作为相关使用者;及将每个相关使用者的搜索历程通过所述终端设备呈现给所述第一使用者。本发明专利技术还提供一种搜索系统。利用本系统及方法可以借助具有相同搜索目的的其他使用者的搜索历程快速找到自己需要的网页。

【技术实现步骤摘要】
搜索系统及方法
本专利技术涉及互联网
,尤其是关于一种搜索系统及方法。
技术介绍
计算机网络技术的发展极大地提高了人们获取信息的便利性。计算机网络中存储了海量的信息,为了便于人们查找到自己所需的信息,各种搜索引擎被广泛使用。传统的搜索引擎很大程度上依赖于使用者输入的关键词,根据使用者提供的关键词给使用者提供相关的搜索结果。然而,正由于计算机网络中数据量非常庞大,根据使用者提供的关键词搜索的网页通常也是非常多,有时甚至多达数百万,而这其中会有相当一部分网页虽然包括使用者输入的关键词,但是可能与使用者所要了解的信息并无关。因此,使用者想要从如此之多的网页中筛选出其所需要的网页是一件费时费力的事情。
技术实现思路
鉴于以上内容,有必要提出一种搜索系统及方法,其可以帮助使用者快速地找到其所需要的网页。所述的搜索系统包括:关键字接收模块,用于接收第一使用者透过一个终端设备输入的第一关键字;相关关键字分析模块,用于从根据所述第一关键字返回的网页中选择R个相关关键字;相关使用者分析模块,用于从曾经使用过所述第一关键字进行网页搜索的其他使用者中选择一个或者多个作为相关使用者;及显示模块,用于将每个相关使用者的搜索历程通过所述终端设备呈现给所述第一使用者。所述的搜索方法包括:接收第一使用者透过一个终端设备输入的第一关键字;从根据所述第一关键字返回的网页中选择R个相关关键字;从曾经使用过所述第一关键字进行网页搜索的其他使用者中选择一个或者多个作为相关使用者;及将每个相关使用者的搜索历程通过所述终端设备呈现给所述第一使用者。利用本专利技术所提供的搜索系统及方法可以借助具有相同搜索目的的其他使用者的搜索历程快速找到自己需要的网页。附图说明图1是本专利技术搜索系统较佳实施例的应用环境图。图2是本专利技术搜索系统较佳实施例的功能模块图。图3是本专利技术搜索方法较佳实施例的方法流程图。图4是一个相关使用者的搜索历程的示意图。主要元件符号说明如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施方式参阅图1所示,是本专利技术搜索系统较佳实施例的应用环境图。所述搜索系统10应用于应用服务器1中。所述应用服务器1透过网络与多个终端设备2及一个网页服务器3通讯连接。所述网络可以是国际互联网或者企业内部网等。所述终端设备2可以是个人计算机、平板电脑、PDA(personaldigitalassistant,个人数字助理)、智能手机等电子终端设备。所述网页服务器3用于提供网上信息的浏览服务。网页服务器3得到应用服务器1传送的网页请求后,将所需网页通过应用服务器1发送给对应的终端设备2。本专利技术的其他实施例中,所述网页服务器3也可以与所述应用服务器1结合成为一个带应用程序服务器的Web服务器。参阅图2所示,是本专利技术搜索系统较佳实施例的功能模块图。本专利技术所述搜索系统10包括多个由程序化代码所组成的功能模块(如下所述),具有接收第一使用者输入的第一关键字,根据该第一关键字分析出若干个相关关键字,并根据该若干相关关键字查找出一个或者多个具有相同搜索目的的相关使用者,将其搜索历程展现给所述第一使用者,以帮助所述第一使用者快速找到自己需要的网页的功能。具有相同搜索目的是指曾经用过所述第一关键字进行网页搜索。所述的搜索历程可以包括使用过的关键字及浏览过的与所述关键字相关连的网页等。所述搜索系统10的程序化代码存储在应用服务器1的存储单元20中,并由应用服务器1的控制单元30所执行以实现其功能。应用服务器1的存储单元20可以为智能媒体卡(smartmediacard)、安全数字卡(securedigitalcard)、快闪存储器卡(flashcard)等储存设备。所述应用服务器1的控制单元30可以为中央处理器等。本实施例中,所述搜索系统10中由程序化代码所组成的功能模块包括关键字接收模块100、相关关键字分析模块101、相关使用者分析模块102、显示模块103及存储模块104。以下结合图3说明模块100~104的功能。参阅图3所示,是本专利技术搜索方法较佳实施例的方法流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。步骤S01,关键字接收模块100接收第一使用者透过终端设备2的浏览器在一个搜索引擎中输入的一个第一关键字。步骤S02,相关关键字分析模块101从根据所述第一关键字返回的搜索网页中获取其中的N个网页。应该可以了解,当输入所述第一关键字之后,搜索引擎会返回所有包括所述第一关键字的网页,所述相关关键字分析模块选择其中的N个网页。所选择的N个网页可以是所述所有网页的前N个,也可以是根据预先设定的规则选择的。步骤S03,相关关键字分析模块101将所述N个网页中的所有名词或者名词片语利用一种加权算法进行权值计算,计算出每个名词或者名词片语的权值。所述名词是指表示人或事物的词如“计算机”、“用户”、“使用者”、“网络”等等,名词片语是指由几个名词或名词及其修饰语构成的片语,如“计算机网络”、“授权用户”等。本专利技术较佳实施例采用的加权算法是TF-IDF(termfrequency–inversedocumentfrequency,词频-逆向文件频率)加权算法。所述TF-IDF是一种用于资讯检索与资讯探勘的加权技术,用以评估一个名词或者名词片语对于所述的N个网页的其中一个网页的重要程度。名词或者名词片语的重要性随着它在同一个网页中出现的次数成正比增加,但同时会随着它在所述N个网页中出现的频率成反比下降。例如,一个网页中总的名词或者名词片语的个数是100个,而名词“计算机”出现了3次,那么“计算机”一词在该网页中的词频(TF)就是3/100=0.03。而如果“计算机”一词在1,000个网页出现过,而网页的总数N是10,000,000,其逆向文件频率(IDF)就是log(10,000,000/1,000)=4,因此,“计算机”一词的权值为0.03*4=0.12。本专利技术的其他实施例也可以采用单独的TF(termfrequency,词频)加权算法,即不考虑名词或者名词片语在所述N个网页中出现的频率。此外,本专利技术的其他实施例也可以采用Boolean加权算法。所述Boolean加权算法是指在一个网页中随机抽取几个名词或者名词片语,计算其在该网页中出现的频率。本专利技术的其他实施例也可以不用计算网页中的所有名词或者名词片语的权值,而是利用socialbookmarksTag(社群标签)方法获取每个使用者对某个网页标注的标签,计算每个标签被使用的频率。例如,使用者b在收藏网页a时标注的标签为“计算机”,使用者c在收藏网页a时标注的标签为“数据处理设备”,…,则相关关键字分析模块101计算每个标签被使用的频率作为该每个标签的权值。步骤S04,相关关键字分析模块101将所述N个网页中的所有名词或者名词片语根据其权值进行排序,并根据该排序选择其中权值较高的R个名词或者名词片语作为相关关键字。当所述名词或者名词片语根据其权值为降序排序时,相关关键字分析模块101选择其中的前R个,而当所述名词或者名词片语根据其权值为升序排序时,相关关键字分析模块101选择其中的后R个。步骤S05,相关使用者分析模块102查找曾经使用过所述第一关键字进行网页搜索的其他使用者。例如,若如上所述的步骤S0本文档来自技高网...
搜索系统及方法

【技术保护点】
一种搜索系统,其特征在于,该系统包括:关键字接收模块,用于接收第一使用者透过一个终端设备输入的第一关键字;相关关键字分析模块,用于从根据所述第一关键字返回的网页中选择R个相关关键字;相关使用者分析模块,用于从曾经使用过所述第一关键字进行网页搜索的其他使用者中选择一个或者多个作为相关使用者;及显示模块,用于将每个相关使用者的搜索历程通过所述终端设备呈现给所述第一使用者。

【技术特征摘要】
1.一种搜索系统,其特征在于,该系统包括:关键字接收模块,用于接收第一使用者透过一个终端设备输入的第一关键字;相关关键字分析模块,用于从根据所述第一关键字返回的网页中选择R个相关关键字;相关使用者分析模块,用于从曾经使用过所述第一关键字进行网页搜索的其他使用者中选择一个或者多个作为相关使用者;其中,所述相关使用者的选择采用如下方法:获取所述每一个其他使用者在根据所述第一关键字返回的搜索网页中浏览过的网页;获取所浏览过的网页中的所有名词或者名词片语,并与上述的R个相关关键字求交集,计算交集中的关键字的个数S;计算所述每一个其他使用者的评估值V,其中V=S/R;及选择其中评估值较高的一个或者多个其他使用者做为相关使用者;及显示模块,用于将每个相关使用者的搜索历程通过所述终端设备呈现给所述第一使用者。2.如权利要求1所述的搜索系统,其特征在于,所述R个相关关键字利用如下方法选择:从根据所述第一关键字返回的搜索网页中获取其中的N个网页;将所述N个网页中的所有名词或者名词片语利用一种加权算法进行权值计算,计算出每个名词或者名词片语的权值;及将所述N个网页中的所有名词或者名词片语根据其权值进行排序,并根据该排序选择其中权值较高的R个名词或者名词片语...

【专利技术属性】
技术研发人员:李忠一叶建发柳岳岑卢俊锜
申请(专利权)人:鸿富锦精密工业深圳有限公司 鸿海精密工业股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1