网页收录方法和装置制造方法及图纸

技术编号:13796142 阅读:18 留言:0更新日期:2016-10-06 14:43
本公开揭示了一种网页收录方法和装置,属于互联网技术领域。所述网页收录方法包括:接收用于请求访问网页的访问请求,所述网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容;根据所述访问请求检测所述网页的访问者是否为搜索引擎;若所述访问者是所述搜索引擎,则将所述网页转换为超文本链接标示语言HTML格式,并返回所述HTML格式的所述网页至所述搜索引擎,所述搜索引擎用于对所述网页进行收录;解决了相关技术中使用HTML5和JavaScript开发的网页通常存在不能被搜索引擎收录的问题;达到了上述网页能够被搜索引擎正常收录的效果。

【技术实现步骤摘要】

本公开涉及互联网
,特别涉及一种网页收录方法和装置
技术介绍
随着HTML5(Hypertext Markup Language,超文本链接标示语言5)技术和JavaScript技术的发展,越来越多的网页开发人员开始使用HTML5和JavaScript来开发网页。然而,由于目前的搜索引擎只能收录纯html的网页,基于JavaScript编程语言开发的网站无法被搜索引擎收录,并且HTML5网页通常也是使用JavaScript编程语言来编程的,所以上述使用HTML5和JavaScript开发的网页通常存在不能被搜索引擎收录的问题。
技术实现思路
本公开提供了一种网页收录方法和装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种网页收录方法,包括:接收用于请求访问网页的访问请求,网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容;根据访问请求检测网页的访问者是否为搜索引擎;若访问者是搜索引擎,则将网页转换为HTML格式,并返回HTML格式的网页至搜索引擎,搜索引擎用于对网页进行收录。可选地,该根据访问请求检测网页的访问者是否为搜索引擎,包括:读取访问请求中携带的访问者的身份标识;检测身份标识是否为搜索引擎所对应的身份标识。可选地,该将网页转换为HTML格式,包括:若网页包括基于JavaScript开发的网页内容,则通过Webkit引擎将基于JavaScript开发的网页内容转换为HTML格式。可选地,该将网页转换为HTML格式,包括:若网页包括基于Flash开发的网页内容,则通过Flash引擎将基于Flash开发的网页内容转换为HTML格式。可选地,该方法还包括:若访问者是用户终端,则返回网页至用户终端。根据本公开实施例的第二方面,提供一种网页收录装置,包括:接收模块,被配置为接收用于请求访问网页的访问请求,网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容;检测模块,被配置为根据接收模块接收到的访问请求检测网页的访问者是否为搜索引擎;转换模块,被配置为在检测模块的检测结果为访问者是搜索引擎时,将网页转换为HTML格式;第一返回模块,被配置为返回转换模块转换得到的HTML格式的网页至搜索引擎,搜索引擎用于对网页进行收录。可选地,该检测模块,包括:读取子模块,被配置为读取访问请求中携带的访问者的身份标识;检测子模块,被配置为检测读取子模块读取到的身份标识是否为搜索引擎所对应的身份标识。可选地,该转换模块,被配置为:在网页包括基于JavaScript开发的网页内容时,通过Webkit引擎将基于JavaScript开发的网页内容转换为HTML格式。可选地,该转换模块,被配置为:在网页包括基于Flash开发的网页内容时,通过Flash引擎将基于Flash开发的网页内容转换为HTML格式。可选地,其特征在于,该装置包括:第二返回模块,被配置为在检测模块的检测结果为访问者是用户终端时,返回网页至用户终端。根据本公开实施例的第三方面,提供一种网页收录装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为:接收用于请求访问网页的访问请求,网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容;根据访问请求检测网页的访问者是否为搜索引擎;若访问者是搜索引擎,则将网页转换为HTML格式,并返回HTML格式的网页至搜索引擎,搜索引擎用于对网页进行收录。本公开的实施例提供的技术方案可以包括以下有益效果:通过在接收到用于请求访问网页的网页请求之后,该网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容;检测该网页的访问者是否为搜索引擎,当访问者为搜索引擎时,将网页转换为HTML格式,然后返回HTML格式的网页至搜索引擎,搜索引擎用于对网页进行收录;解决了相关技术中使用HTML5和JavaScript开发的网页通常存在不能被搜索引擎收录的问题;达到了上述网页能够被搜索引擎正常收录的效果。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并于说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的一种网页收录方法的流程图。图2是根据另一示例性实施例示出的一种网页收录方法的流程图。图3是根据一示例性实施例示出的一种网页收录装置的框图。图4是根据另一示例性实施例示出的一种网页收录装置的框图。图5是根据一示例性实施例示出的一种用于收录网页的装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方
式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种网页收录方法的流程图。如图1所示,该网页收录方法可以包括以下步骤。在步骤101中,接收用于请求访问网页的访问请求,网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容。在步骤102中,根据访问请求检测网页的访问者是否为搜索引擎。在步骤103中,若访问者是搜索引擎,则将网页转换为HTML格式,并返回HTML格式的网页至搜索引擎,搜索引擎用于对网页进行收录。综上所述,本公开实施例中提供的网页收录方法,通过在接收到用于请求访问网页的网页请求之后,该网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容;检测该网页的访问者是否为搜索引擎,当访问者为搜索引擎时,将网页转换为HTML格式,然后返回HTML格式的网页至搜索引擎,搜索引擎用于对网页进行收录;解决了相关技术中使用HTML5和JavaScript开发的网页通常存在不能被搜索引擎收录的问题;达到了上述网页能够被搜索引擎正常收录的效果。图2是根据一示例性实施例示出的一种网页收录方法的流程图。如图2所示,该网页收录方法可以包括以下步骤。在步骤201中,接收用于请求访问网页的访问请求,网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容。当网页被访问时,为该网页提供服务的服务器可以接收到访问者发送的用于请求访问该网页的访问请求。其中,网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容。比如,当搜索引擎想要对某一网页进行收录时,搜索引擎可以发送请求访问该网页的访问请求至服务器。当用户想要访问某一网页时,用户可以通过用户终端发送请求访问该网页的访问请求至服务器。而为了标识自身的身份,搜索引擎或者用户终端可以发送携带有自身的身份标识的访问请求至服务器。可选地,访问请求的头信息中可以包括User-Agent
属性,搜索引擎或者用户终端在该属性中携带自身的身份标识。比如,搜索引擎在访问网页时,搜索引擎可以在发送的Http访问请求的头信息中携带‘1’;用户终端在访问该网页时,用户终端发送的Http访问请求的头信息中可以携带‘0’。其中,‘1’用于表示访问者为搜索引擎本文档来自技高网
...

【技术保护点】
一种网页收录方法,其特征在于,包括:接收用于请求访问网页的访问请求,所述网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容;根据所述访问请求检测所述网页的访问者是否为搜索引擎;若所述访问者是所述搜索引擎,则将所述网页转换为超文本链接标示语言HTML格式,并返回所述HTML格式的所述网页至所述搜索引擎,所述搜索引擎用于对所述网页进行收录。

【技术特征摘要】
1.一种网页收录方法,其特征在于,包括:接收用于请求访问网页的访问请求,所述网页包括基于JavaScript和Flash中的至少一种语言所开发的网页内容;根据所述访问请求检测所述网页的访问者是否为搜索引擎;若所述访问者是所述搜索引擎,则将所述网页转换为超文本链接标示语言HTML格式,并返回所述HTML格式的所述网页至所述搜索引擎,所述搜索引擎用于对所述网页进行收录。2.根据权利要求1所述的方法,其特征在于,所述根据所述访问请求检测所述网页的访问者是否为搜索引擎,包括:读取所述访问请求中携带的所述访问者的身份标识;检测所述身份标识是否为所述搜索引擎所对应的身份标识。3.根据权利要求1所述的方法,其特征在于,所述将所述网页转换为HTML格式,包括:若所述网页包括基于JavaScript开发的网页内容,则通过Webkit引擎将所述基于JavaScript开发的网页内容转换为所述HTML格式。4.根据权利要求1所述的方法,其特征在于,所述将所述网页转换为HTML格式,包括:若所述网页包括基于Flash开发的网页内容,则通过Flash引擎将所述基于Flash开发的网页内容转换为所述HTML格式。5.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:若所述访问者是用户终端,则返回所述网页至所述用户终端。6.一种网页收录装置,其特征在于,包括:接收模块,被配置为接收用于请求访问网页的访问请求,所述网页包括基
\t于JavaScript和Flash中的至少一种语言所开发的网页内容;检测模块,被配置为根据所述接收模块接收到的所述访问请求检测所述网页的访问者是否为搜索引擎;转换模块,被配置为在所述检测模块的检测结果为...

【专利技术属性】
技术研发人员:谭国斌马哲沈建荣
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1