当前位置: 首页 > 专利查询>NHN株式会社专利>正文

将网站信息登录到搜索引擎的方法及利用该方法的网站搜索服务方法技术

技术编号:2856714 阅读:238 留言:0更新日期:2012-04-11 18:40
一种向搜索引擎登录网站信息的方法,其特征在于,包括如下步骤:    接收来自用户的所述网站登录申请;    存储所述网站登录相关的信息;    以预定时间周期提取所述数据;    将提取的所述数据与隔一段之间提取的数据合并(merge);    及,以预定时间为周期索引所述合并的数据;。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及在具有多种信息的互联网中提供特定网站信息的搜索引擎。更详细地讲是涉及一种将预定网站的信息登录到搜索引擎的方法及利用所述方法登录的网站信息提供给搜索引擎用户的方法。
技术介绍
altavista(http//www.altavista.com)、lycos(http//www.lycos.com)、yahoo(http//www.yahoo.com)等常用的搜索引擎由将传统网站信息根据一定标准分类存储并管理的数据库;不断循环于网络中,机械式搜集新的网站信息的用软件实现的蜘蛛(spider);将搜集的数据数据库化,使利用所述搜索引擎用户可以搜索的搜索引擎软件组成。图1示出了提供这种常用搜索引擎服务的整个系统的分程序图。参照图1可知,用户利用用户终端110通过互联网连接到搜索引擎服务器150。当用户输入预定搜索语时,搜索引擎服务器150用搜索引擎软件140询问(query)相关搜索语的网站信息,搜索引擎软件140搜索相关数据库130告知预定的网站信息。蜘蛛120如上所述,是一种不断循环于网络中,从网络服务器160机械式搜集网站信息的用软件实现的实体(entity)。蜘蛛120探索互联网中以HTML(HyperText Markup Language)记述的文章,分析(parsing)记载的链接处,从互联网中的网络服务器160搜集数据。这种被蜘蛛120搜集的数据被数据库化,在这里,数据库化是指进行网站中对于预定信息的形态化分析(morphological analysis),制作索引表并存储到数据库130中的一连串次序。数据库130存储蜘蛛120搜索的所有网站信息。搜索引擎软件140的功能是将搜索结果显示给用户。该软件搜索数据库130中存储的无数个网页,将搜索结果以与搜索语一致的正确度循序排列。图1中搜索服务器150和搜索引擎部120、130、140图示成多个实体,但这仅仅是为了说明的简便,也可以是同一个实体。通过利用这种蜘蛛的信息搜集,提供预定网站信息时,现有的搜索引擎会遇到如下问题。(1)、随着网络上产生很多网站,需要存储及管理的数据将会急剧增加。(2)、无法评判在这些急剧增加的数据中哪些数据有价值。(3)、通过蜘蛛的网站信息提取局限于HTML等文本为基础建立的网站,因此很难提取以图片为基础建立的网站的信息。为了解决上述缺点,现有的搜索引擎中提供了接收用户的网站登录申请后登录搜索引擎的服务,很好地协调了运营搜索引擎的商家的利益和通过登录最大化自己网站广告效果的用户的利益。通过这种登录的搜索引擎服务的提供随着2000年美国雅虎第一次实现收费化以来,现在大部分搜索引擎运营公司都提供着这种收费登录服务。随着这种收费登录服务的使用,用户的要求也不断产生变化,以往的这种收费登录服务自收到用户的登录申请后,需要晚则2周、早则3-5天的时间,因此,具有无法迅速响应需要登录的用户要求的缺点。现在,国外著名的搜索引擎,例如,altavista、yahoo、lycos等在用户登录申请日开始至少需要2-5天的时间才可以实际登录到搜索引擎。这是因为,在以往的搜索引擎中,反应新的登录申请的网站信息后制作索引文件时受到系统限制或碰到运营上的问题,需要如上所述的2周至3-5天的时间,但它不仅不能迅速响应需要登录用户的多种要求,而且还无法针对不同用户提供更为多样和差别化的登录服务。
技术实现思路
根据本专利技术,将网站信息登录到搜索引擎的方法,其目的在于,实时或在短时间内将用户申请登录的网站信息登录到搜索引擎,可以迅速响应需要快速登录的各种用户的要求。根据本专利技术,将网站信息登录于搜索引擎的方法,其目的在于,将用户申请登录的网站信息根据预定金额的时间间隔登录到搜索引擎,不仅可以拓宽用户的选择性,还可以通过搜索引擎创造新的创收模式。根据本专利技术的向搜索引擎登录网站提供搜索信息服务的方法,其目的在于,将网站信息迅速登录到搜索引擎,向第三者迅速提供登录的所述网站信息。根据本专利技术优先实施例的向搜索引擎登录网站信息的方法包括如下方法,包括如下步骤接收来自用户的所述网站登录申请;存储与所述网站登录相关的数据;以预定时间为周期提取所述数据;将提取的所述数据隔一段时间与提取的数据合并;及将所述合并的数据以预定时间周期进行索引。而且,根据本专利技术一实施例的将网站信息登录于搜索引擎的方法,其特征在于,包括如下步骤接收来自用户的所述网站登录申请;存储与所述网站登录相关的数据;以预定时间为周期提取所述数据;及,以预定时间为周期索引所述提取数据。根据本专利技术一实施例的向搜索引擎登录网站信息,提供搜索服务的方法,其特征在于,包括如下步骤接收来自用户的所述网站登录申请;存储与所述网站登录相关的数据;以预定时间为周期提取所述数据;以预定时间为周期索引所述提取数据;隔一段时间索引已提取数据;接收搜索服务用户输入的预定搜索语;参照所述已索引数据和隔一段时间提取并被索引的数据,搜索对应所述预定搜索语的数据;及,将搜索的对应数据根据预定标准显示。附图说明图1是提供网站搜索引擎服务的整个系统的结构分程序图;图2是根据本专利技术实施例的网站搜索引擎结构分程序图;图3示出以往搜索引擎执行的网站信息登录程序的分程序图;图4示出图3的以往搜索引擎执行的网站信息登录步骤流程流程图;图5示出根据本专利技术一实施例的搜索引擎执行的网站信息登录程序的分程序图;图6示出图5的根据本专利技术一实施例的搜索引擎执行的网站信息登录步骤流程的流程图;图7示出根据本专利技术另一个实施例的搜索引擎执行的网站信息登录程序的分程序图;图8示出图7的根据本专利技术另一个实施例的搜索引擎执行的网站信息登录步骤流程的流程图;图9示出图7的根据本专利技术另一个实施例的搜索引擎执行的提供搜索服务流程的流程图。具体实施例下面参照附图详细说明根据本专利技术的向搜索引擎登录网站信息的方法及利用该方法的网站信息搜索服务方法。图2是根据本专利技术一实施例的网站搜索引擎结构分程序图。参照图2可知,用户通过终端机210向搜索引擎传送网站的登录申请及网站信息。存储件220存储这种网站信息,冲浪者(surfer)等专业验收者230查看存储的所述网站信息,检查所述网站的登录事项,将这些进行适当的修改及补充。提取部250提取所述修改及补充的网站登录事项等数据,分度器240索引所述提取数据,被索引的数据又重新存储于存储件220内的索引数据库(未图示)。根据本专利技术优先实施例的搜索引擎执行的数据提取(extract)是指将存储与存储件中的数据按照搜索引擎使用的特定格式提取并以文本文件形式存储。而且,索引(indexing)是指将所述提取的数据变换为搜索引擎可以进行搜索的格式。通常,搜索引擎的索引不具有某种典型的领域,只整理成搜索引擎可以进行搜索的数据。然而,也会有搜索引擎的索引与数据库中的索引相同的情况,altavista的情况对数据进行了索引,以便将网络文章的题目、内容、URL进行特别化进行搜索。通常,索引网页由URL(Uniform ResourceLocator)、关键字、属性信息组成。URL是访问网页数据所需的信息,包括有协议、域名、端口号、路径名称等信息。关键字为了搜索,属性信息可以由索引网页的更新日期等信息组成。图3示出以往搜索引擎执行的网站信息登录程序的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种向搜索引擎登录网站信息的方法,其特征在于,包括如下步骤接收来自用户的所述网站登录申请;存储所述网站登录相关的信息;以预定时间周期提取所述数据;将提取的所述数据与隔一段之间提取的数据合并(merge);及,以预定时间为周期索引所述合并的数据;2.一种向搜索引擎登录网站的方法,其特征在于,包括如下步骤接收来自用户的所述网站登录申请;存储所述网站登录相关的数据;以预定时间为周期提取所述数据;以预定时间为周期索引提取的所述数据;及,合并(merge)所述索引的数据和隔一段时间索引的数据。3.一种向搜索引擎登录网站的方法,其特征在于,包括如下步骤接收来自用户的所述网站登录申请;存储所述网站登录相关数据;以预定时间为周期提取所述数据;及,以预定时间为周期索引所述提取的数据。4.根据权利要求书1至3任何一项所述的一种向搜索引擎登录网站的方法,其特征在于,所述提取步骤中的所述预定时间周期为0。5.根据权利要求书1至3任何一项所述的一种向搜索引擎登录网站的方法,其特征在于,所述索引步骤中的所述预定时间周期为0。6.根据权利要求书1或2所述的一种向搜索引擎登录网站的方法,其特征在于,所述合并步骤中所述一段时间以一天为单位。7.根据权利要求书1至3任何一项所述的一种向搜索引擎登录网...

【专利技术属性】
技术研发人员:李宇晟姜春植
申请(专利权)人:NHN株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1