【技术实现步骤摘要】
获取资源的下载链接的方法及系统
本专利技术涉及计算机网络
,具体涉及获取资源的下载链接的方法及系统。
技术介绍
随着计算机网络的飞速发展和计算机设备的普及,越来越多的用户通过互联网获取各种信息和各种所需的资源,网络下载成为用户获取互联网资源的主要手段之一。为了更好满足用户不断提高的下载需求,互联网上出现了大量以资源下载为主要服务的网络站点,很多综合类门户网站也会提供网络资源的下载服务。这些站点中有的专门提供某一类资源的下载服务,如专门提供文档资料、音/视频、软件等类别中的某一类下载服务的站点,有的则提供了相对全面的多类别综合下载服务,下载服务和网络资源的不断增加,为用户在互联网上获取各种资源提供了便利。当然,还有一些网站可能并不是专门提供下载服务的网站,但是偶尔也会有些资源可供下载。例如,某论坛网站,其主要服务是为用户提供交流平台,但也可能有些用户上传一些资料等文件,可以供其他用户下载。通常,用户在网络上下载所需的资源,需要先定位到目标网络资源,然后才能根据目标网络资源的网络位置进行下载。定位目标网络资源的手段有多种,例如使用搜索引擎,以所需资源的关键词或者目标下载站点的信息进行检索,通过搜索引擎提供的搜索结果到达目标资源的下载页面;或者输入地址访问下载站点或者下载页面,进而获取所需资源的下载链接。但在这些目标资源的下载页面中,有的需要通过输入验证码或需要登录等方式才能获取的资源下载链接;有的则出于增加点击率,将资源的下载链接设计在了当前下载页面的下级子页面中;甚至为了推广产品等目的,有的下载页面中包含虚假的资源下载链接误导用户点击;这些都给用户从下 ...
【技术保护点】
一种获取资源的下载链接的方法,其特征在于,包括:获取用户通过网页跳转最终进行资源下载的跳转行为;根据所述跳转行为,生成访问下载链接的跳转路径;当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户。
【技术特征摘要】
1.一种获取资源的下载链接的方法,其特征在于,包括:获取用户通过网页跳转最终进行资源下载的跳转行为,包括:获取用户从预定范围的网页为起始,通过网页跳转最终进行资源下载的跳转行为;根据所述跳转行为,生成访问下载链接的跳转路径,包括:根据所述跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径;当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户。2.根据权利要求1所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接;所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:根据获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。3.根据权利要求2所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:通过浏览器程序,获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接;所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:根据浏览器程序获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。4.根据权利要求1所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接;所述跳转方式用于标识跳转的目标是另一个网页,或者是一个下载链接;所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:根据所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。5.根据权利要求4所述的方法,其特征在于,所述获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接,包括:在产生通过网页跳转最终进行资源下载的跳转行为时,由浏览器程序获取所述用户标识信息,并将所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接记录为跳转日志;所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:根据所述跳转日志中记录的所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。6.根据权利要求5所述的方法,其特征在于,所述浏览器程序将获取到的所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址、以及相应的下载链接记录为日志,并上传至服务器端;所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:由服务器端根据接收到的所述日志,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。7.根据权利要求1所述的方法,其特征在于,所述根据所述跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径,包括:根据所述跳转行为中,以所述预定范围内的网页起始经过次数小于预置阈值的跳转最终进行资源下载的跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径。8.根据权利要求7所述的方法,其特征在于,还包括:以预置的判定方法对所述跳转路径上的下载链接进行过滤;所述当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户,包括:当用户访问所述跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。9.根据权利要求8所述的方法,其特征在于,所述预置的判定方法为特征阈值判定,用于判定的特征为以下的至少一种:以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接的平均路径长度;以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数;以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数,与由该起始网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;由所述预定范围的网页开始跳转而进行资源下载的次数,与由该起始网页开始的不区分目的的所有跳转的跳转次数比;以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接是否需要提供用户认证信息;以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接对应文件的文件类型;所述以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括:对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接;或,根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。10.根据权利要求1-6任一项所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:统计用户通过网页跳转最终进行资源下载的过程中网页跳转的次数,当所述跳转的次数小于预置的次数阈值时,获取用户通过网页跳转最终进行资源下载的跳转行为。11.根据权利要求1-6任一项所述的方法,其特征在于,还包括:以预置的判定方法对所述跳转路径上的下载链接进行过滤;所述当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户,包括:当用户访问所述跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。12.根据权利要求11所述的方法,其特征在于,所述预置的判定方法为特征阈值判定,用于判定的特征为以下的至少一种:由同一网页通过不同的跳转路径上到达同一下载链接时,由该网页到达该下载链接的平均路径长度;跳转路径上一网页到达下载链接,该下载链接被下载的下载次数;由一网页到达一下载链接,该下载链接被下载的下载次数,与由该网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;由一网页开始跳转而进行资源下载的次数,与由该网页开始的不区分目的的所有跳转的跳转次数比;由一网页跳转到达一下载链接,访问该下载链接是否需要提供用户认证信息;通过网页跳转到达一下载链接,该下载链接对应文件的文件类型;所述当用户访问所述跳转路径上的网页时,以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括:对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接;或,根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。13.根据权利要求12所述的方法,其特征在于,所述预置的判断方法还包括预置模板判定,所述方法,包括:利用预置的判断模板对所述跳转路径上的网页,以及对应的所述下载链接的URL进行相关度判断,并产生一判断结果,根据所述判断结果对所述跳转路径上的下载链接进行过滤;其中,所述预置的判断模板包括:预置的判断用户访问网页和下载链接的URL相关度的正则表达式模板。14.根据权利要求11所述的方法,其特征在于,所述以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括:对所述下载链接进行有效性检测,如果检测所述下载链接为有效链接,则将该下载链接确定为过滤后得到的下载链接。15.根据权利要求1-7任一项所述的方法,其特征在于,还包括:检测所述下载链接的链接类型,所述链接类型用于指示所述下载链接是否为特定下载工具的专用链接;如果检测到所述下载链接类型为所述专用链接,则在将所述跳转路径上的下载链接呈现给用户的同时,显示该链接的链接类型。16.根据权利要求1-7任一项所述的方法,其特征在于,所述将所述跳转路径上的下载链接呈现给用户,包括:将所述跳转路径上的下载链接以操作系统弹出...
【专利技术属性】
技术研发人员:田乐逍,胡又欢,肖镜辉,
申请(专利权)人:北京搜狗信息服务有限公司,北京搜狗科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。