面向信息发布类网站的移动版自动生成的方法技术

技术编号：14826055 阅读：36 留言：0更新日期：2017-03-16 13:32

本发明专利技术涉及一种面向信息发布类网站的移动版自动生成的方法，其包括以下步骤：利用爬虫技术，根据用户指定转化网站的入口地址，爬取该网站中的所有网页；对爬取网站中的所有网页进行分析，针对每一个网页提取导航栏中的数据和网页中的主要内容；将提取的结构化数据经过适配转化为适应移动端页面展示风格的数据。采用本发明专利技术技术方案用户只需要给出该网站的入口地址，就能够自动生成适合手机浏览移动版网站。在这个过程中通过网页爬取，数据提取，网页适配完成来完成移动端页面的生成。本发明专利技术极大地较少了开发移动版的成本并且减少了移动版网站的开发周期，具有很强的商业价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及大数据挖掘生成领域，具体涉及一种面向信息发布类网站的移动版自动生成的方法。
技术介绍
随着3G、4G网络的普及，手机上网日趋便利，智能手机成为互联网用户一种重要的信息获取设备。但是，传统的信息发布类网站通常针对PC终端进行开发，其页面布局和内容字号等网页风格仅适合电脑屏幕，而不适合手机屏幕，通过手机浏览网页用户体验差。其次，与PC端网页不同，因为带宽和流量的限制，移动端的网页无法像PC端那样具有丰富的动态功能和大量的图片，事实上，移动端网站的设计应该尽可能的简洁。于是，大型企业往往针对同一个信息发布类网站，分别开发一个PC版本和一个移动版本，并根据接入终端的类型，提供不同的服务。然而，额外开发一个移动版本费用较高，给小微型企业带来较大的负担。因此，通过较低的成本获得一个基本可用的网站移动版本，是大量小微型企业的迫切需求。为了满足市场需求本文提出了一种信息发布类网站的移动版自动生成的方法。利用本方法用户只需要输入网站的网址就可以将该站点的所有页面转化为适应移动端的页面大小的网页，并且在PC端页面转化为移动端页面的同时去除页面中与主要内容无关的部分，只展示PC端页面中的主要内容部分。这种方法不仅能够节省网页下载的时间和流量，也方便用户浏览页面。信息发布类网站的自动生成的方法主要存在两个方面的挑战：一方面，PC端页面展示的内容与移动端页面展示的内容存在差异，移动端页面只需要展示主体内容，所以，如何抽取网站的组织架构和每个网页的主要内容是一个难题。另一方面，PC端复杂的网页页面结构如何适配到移动端相对简单的页面结构。
技术实现思路
本专利技术的目的是提...
面向信息发布类网站的移动版自动生成的方法

【技术保护点】
一种面向信息发布类网站的移动版自动生成的方法，其特征在于，包括以下步骤：步骤S1：利用爬虫技术，根据用户指定转化网站的入口地址，爬取该网站中的所有网页；步骤S2：对爬取网站中的所有网页进行分析，针对每一个网页提取导航栏中的数据和网页中的主要内容；步骤S3：将提取的结构化数据经过适配转化为适应移动端页面展示风格的数据。

【技术特征摘要】
1.一种面向信息发布类网站的移动版自动生成的方法，其特征在于，包括以下步骤：步骤S1：利用爬虫技术，根据用户指定转化网站的入口地址，爬取该网站中的所有网页；步骤S2：对爬取网站中的所有网页进行分析，针对每一个网页提取导航栏中的数据和网页中的主要内容；步骤S3：将提取的结构化数据经过适配转化为适应移动...

【专利技术属性】
技术研发人员：陈星，王一洲，戴远飞，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人