一种用于URL重写的方法和设备技术

技术编号:3755156 阅读:159 留言:0更新日期:2012-04-11 18:40
一种用于重写导致错误消息生成的URL的方法和设备。扫描所述URL,用于在其字符中检测一个或多个属于预定字符列表中的字符的存在。如果所述扫描导致与所述字符列表中的字符的匹配,用给定的替代字符进行取代。如果没有发生匹配,则将该域名和TLD与属于一个字典的补充的域名或URL进行比较。如果与该字典发生匹配,用该字典中匹配的域名或URL进行取代。如果没有发生匹配,应用拼写纠正算法。如果拼写纠正算法仍然不能得到纠正的URL,后者被分割和重写。

【技术实现步骤摘要】
一种用于URL重写的方法和设备本专利技术涉及一种用于URL重写的方法,所述方法包括 用户计算机一旦接收一个由用户提供的由字符构成的至少由域名和 TLD组成的URL,监测错误消息的生成,所述错误消息包括数据域, 指示生成的错误从而URL与可识别的因特网协议地址不匹配; * 一旦生成所述错误消息,搜索所述已经导致所述错误消息生成的URL,将所述搜索的URL重路由到URL重写站; 參该方法用于帮助例如输入一个带有已经不再使用的域名的URL的用户。识别该不再使用的域名并由一个现行的域名代替。并且搜索引擎,例如 google,也被用于检测不正确的URL并向用户提供选择。 现有的方法缺点在于这些方法执行能力不强并通常只能改正URL中单 个字符的拼写错误,因此多数情况下当用户输入一个不正确的URL或选择一 个不正确的超链接,他将不能进入所请求的网页并仅得到一个错误消息指示 不知道所请求的URL或不能找到所请求的URL。这样的消息往往会扰乱不能 得到他想要的信息的用户。本专利技术的目的在于提供给用户,特别是因特网用户一个更加有执行能力 的工具用于重写URL并且提供给用户更多的机会使其在使用了错误的URL时 进入他想要的因特网网页。基于该目的,根据本专利技术的方法特征在于所述方法还包括 *在所述重写站中扫描所述被搜索的URL,用于在其字符中检测一个或多个 属于预定字符列表中的字符的存在,所述列表还包括用于每个所述预定 字符的替代字符,并且一旦检测到这样的预定字符,后者被给定的替代 字符所取代,用于将被搜索URL形成一个替代URL; *在所述替代URL中分离所述域名和所述TLD;*将所述域名和属于域名字典中的补充域名进行比较, 一旦存在所述域名和所述补充域名之间的匹配,通过将所述用于重写URL的补充域名取代所述域名来重写所述替代URL; 如果以上步骤没有得到重写的URL,将TLD和属于TLD字典中的补充TLD进行比较, 一旦存在所述TLD与所述补充TLD之间的匹配,通过将所述用于重写URL的补充TLD取代所述TLD来重写所述替代URL; *如果以上步骤没有得到重写的URL,在所述域名上应用拼写纠正算法,并且如果所述25应用导致域名的修改,用所述修改的域名代替所述域名用于重写所述URL;*如果以上步骤没有得到重写URL,将所述域名分成多个分段,且对于每个 分段验证是否30所述分段在语言学上可以接受,如果所述分段在语言学 上不能被接受,用与该分段具有多个相同字符的语言学上可以接受的分 段取代所述分段,通过使用所述替代分段重写所述URL; *将所述重写的URL呈现给用户。 通过用替代字符取代一个明显错误的字符可形成正确的URL,这将很快 将用户路由到正确的站点或至少向因特网用户提供一个合适的URL。通常情 况下会产生同样的输入错误,例如将"a"输入为"z"或是"e",可以建 立一个考虑这些错误的字典。这样一个字典的使用将有助于很容易且很快的 找到正确的URL。如果在字典中找不到正确的URL,在域名上应用拼写纠正 算法。由于URL中的错误经常是由于拼写错误,拼写纠正算法将有助于得到 正确的URL并找到请求的URL。如果拼写纠正算法不能提供解决方法,域名 将被分割为分段并且这些分段被分别处理以用于重写域名。根据本专利技术的方 法,提供用于重写导致无效请求的URL的一系列步骤。本专利技术提出的方法通 过几次纠正尝试,进入想要的因特网站点的可能性将大大增加。根据本专利技术的首选实施例,其特征在于所述预定字符列表包括表示连接 或分离特性的字符的子列表,每个所述子列表的字符有作为替代字符的间隔字符以形成分段的域名。具有连接或分离特性的字符提供可靠的方式去进一 步细分域名到分段,且对组成域名的不同分段进行分段分析。根据本专利技术的第二优选实施例,其特征在于与URL分离之后,扫描所述 TLD用于检测无关字符,且一旦检测到所述无关字符,后者被移除。由于组 成TLD的字符数量是很有限的,扫描所述TLD以检测无关字符可容易且快速 实现,使得TLD被纠正且将存在错误的TLD寻址到请求的站点。根据本专利技术的第三优选实施例,其特征在于,对域名进一步分段分割是 基于具有预定的字符数的分段,扫描每一个分段用于检测在一个分段和一个 所述字典中的可比字之间共同的字符,每一次检测到共同的字符会加分,并 且基于所述得分在分段中定义对应率,所述得到最高分的可比字被选择进行 替换。通过设定分段的字符数的上限使得进一步分割为分段变得容易,而且, 在检测到共同字符时分配得分,使替代选择变得容易。最好对所述得分设定一个低阈值,其中,如果没有得分达到所述阈值,不 提供替代。通过设定一个低阈值,使该方法效率更高,因为成功几率很小的替 代则不再考虑。最好是一旦搜索所述URL,指示实际时间的时间数据也被搜索并附加到 所述URL上。在特定的环境因素下的实际时间将有助于找到正确的URL。 本专利技术还涉及实现该方法的设备。下面将参照附图说明根据本专利技术的方法和设备的优选实施例。 附图说明图1示意性地说明了因特网接入;图2说明了实现本专利技术提出的方法的设备结构;图3说明了处理URL的不同步骤。在图中相同的附图标记代表相同或相似的元件。图1示意性的说明了请求因特网站点的路径。用户,也称为因特网用户, 具有计算机l,通常是PC(个人计算机),具有必要的软件使其可以接入因特网。该计算机1例如经由电话线连接至DNS (域名服务器)2。后者被装 备用于将URL转换至IP (因特网协议)地址。每一个URL至少由三部分组成* l.TLD (顶级域)域名的最高级且通常在URL的结尾处。已知的TLD例如 是"com", "org", "mil", "gov", "eu"和国家代码例如"be","de" , "lu"等……* 2.域名,指示分配给特定实例,公司或通常是站点名的名称。域名的一 个例子为"印o"属于欧洲专利局的因特网地址(www. e。o. org);* 3.主机名,"www"(万维网)或"http"。 当用户形成一个URL,例如www. domainname. com, DNS (2)搜索该URL并将"domainname"转换为IP地址(例如,192. xxx. xxx. xxx)。基于该 目的DNS在其缓存里已经有该地址并很容易在其缓存中搜索到该IP地址。 如果该IP地址不在其缓存中,该DNS寻址到域名主机的根服务器。根服务 器接着将请求的IP地址发送到DNS。 一旦IP地址可用,后者被因特网发送 至服务器4以到达具有使用的IP地址的服务器并且在该服务器上请求的站 点搜索可用的必要信息。用户的PC (1)还与保存多个IP地址的代理服务器(3)进行联系,这 些IP地址通常是用户常用的那些。当用户每次经由键盘或经由超链接形成 URL时,该URL被发送至代理服务器3,它将在因特网上从地址服务器中搜 索该请求数据。该代理服务器将使用IP地址用于找到存贮在自己内部存储 器中的请求站点的地址。当请求的数据已经保存在请求的站点内部存储器中 时,因为有了一个较早的请求,该请求的数据将直接从代理服务器的缓存中 搜索。可能发生用户输入一个错误的URL的情况,例如由于输入错误,或由于 误解信息,导致URL不能被本文档来自技高网...

【技术保护点】
一种用于URL重写的方法,所述方法包括: ●用户计算机一旦接收一个由用户提供的由字符构成的至少由域名和TLD组成的URL,监测错误消息的生成,所述错误消息包括数据域,指示生成的错误从而URL与可识别的因特网协议地址不匹配; ●一 旦生成所述错误消息,搜索所述已经导致所述错误消息生成的URL,将所述搜索的URL重路由到URL重写站; 其特征在于所述方法进一步包括: ●在所述重写站中扫描所述被搜索URL,用于在其字符中检测一个或多个属于预定字符列表中的字符的 存在,所述列表还包括用于每个所述预定字符的替代字符,并且一旦检测到这样的预定字符,后者被给定的替代字符所取代,用于将被搜索URL形成一个替代URL; ●在所述替代URL中分离所述域名和所述TLD; ●将所述域名和属于域名字典中的 补充域名进行比较,一旦存在所述域名和所述补充域名之间的匹配,通过将所述用于重写URL的补充域名取代所述域名来重写所述替代URL; ●如果以上步骤没有得到重写的URL,将TLD和属于TLD字典中的补充TLD进行比较,一旦存在所述TLD与 所述补充TLD之间的匹配,通过将所述用于重写URL的补充TLD取代所述TLD来重写所述替代URL; ●如果以上步骤没有得到重写的URL,在所述域名上应用拼写纠正算法,并且如果所述应用导致域名的修改,用所述修改的域名代替所述域名用于重写 所述URL; ●如果以上步骤没有得到重写URL,将所述域名分成多个分段,且验证所述分段在语言学上是否可以接受,如果所述分段在语言学上不能被接受,用与该分段具有多个相同字符的语言学上可以接受的分段取代所述分段,通过使用所述替代分段重写所 述URL; ●将所述重写的URL呈现给用户。...

【技术特征摘要】

【专利技术属性】
技术研发人员:佛朗索瓦卢克科利侬
申请(专利权)人:佛朗索瓦卢克科利侬
类型:发明
国别省市:FR[法国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1