当前位置: 首页 > 专利查询>山东大学专利>正文

一种本地数据库同步更新远程rss数据的方法技术

技术编号:4296429 阅读:490 留言:0更新日期:2012-04-11 18:40
一种本地数据库同步更新远程rss数据的方法,属网络数据库更新技术领域。其步骤如下:1)内容服务器解析所有的rss源,将解析的rss信息放入本地数据库;2)对得到的rss信息进行分类,整合到内容服务器的本地数据库;3)内容服务器端进行rss内容更新。本发明专利技术方法解决了用户直接访问rss数据存在的速度缓慢以及rss数据分类复杂混乱、操作繁琐的问题。

【技术实现步骤摘要】

本专利技术涉及,属网络数据库更新技 术领域。
技术介绍
RSS也叫聚合RSS,是在线共享内容的一种简易方式(也叫聚合内容,Really SimpleSyndication)。通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,网 站提供RSS输出,有利于让用户获取网站内容的最新更新。RSS可用于在网站间分享信息, 网络用户可以在客户端借助于支持RSS的聚合工具软件(例如Sharp Reader, RSS Reader, NewzCrawler、 Feed Demon),在不打开网站内容页面的情况下阅读支持RSS输出的网站内 容。RSS源是一种描述和同步网站内容的格式,是目前使用最广泛的XML应用。RSS搭建了 信息迅速传播的一个技术平台,使得每个人都成为潜在的信息提供者。发布一个RSS文件 后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些数据都是标准的 XML格式,所以也能在其他的终端和服务中使用。RSS是目前使用最广泛的资源共享应用, 可以被称为资源共享模式的延伸。 RSS的语法介绍RSS是基于文本的格式。它是XML(可扩展标识语言)的一 种形式,简单来说,RSS实际上就是一个XML文件,定义了相关的DTD(Document Type Definition,文档类定义)。 一个RSS文件就是一段规范的XML数据,该文件一般以rss, xml或者rdf作为后缀。通常RSS文件都是标为XML, RSS文件(通常也被称为RSS feeds 或者channels)通常只包含简单的项目(item)列表。 一般而言,每一个项目(item)都含 有一个标题(title),一段简单的介绍(description),还有一个URL链接(link,比如是一 个网页的地址)。而其他的信息,例如日期(pubdate)、创建者的信息(author)等等,都是 可以选择的。RSS的具体结构RSS2. 0文件由一个channel元素及其子元素item构成。所 有的RSS必须遵循XML1. 0标准,根元素〈RSS〉的version (版本)属性指出该文档遵循的 RSS规范。cha皿el元素用于描述RSS feed,它有三个子元素是必须的,分别为〈title〉、 〈description〉、 〈link〉,其中〈title〉描述该RSS源的名称,〈description〉是对该频道 的描述,〈link〉描述频道对应的URL链接;其它子元素是可选的,如〈image〉、〈language〉、 〈category〉、〈copyright〉、〈pubdate〉等,〈image〉定义了显示该频道的GIF, JPEG或者PNG 格式的图片,〈language〉描述该RSS使用的语言,〈category〉声明该频道所属的一个或者 多个分类,〈copyright〉是该RSS的版权声明,〈pubdate〉描述该RSS发布的日期。 〈item〉元素是一个rss文档中最重要的部分,每个〈cha皿el〉元素可拥有一个或 多个〈item〉元素,每个〈item〉元素可定义RSS feed中的一篇文章或story。其内容也 经常变化,用来显示更新的内容。〈item〉元素里的〈title〉、 〈description〉、 〈link〉元素 是必须的,其中〈title〉用于描述该项的名称,〈description〉是对该条目的描述,〈link〉 描述对应的亂链接;还有一些可选项如〈pubdate>、 〈source>、 〈author>、 〈comments>、 〈category〉、〈guid〉等,其中〈pubdate〉是该条目发布的日期,〈source〉为该条目指定一个第三方来源,〈author〉描述作者信息,〈comments〉允许项目连接到有关此项目的注释(文件),〈category〉指出该条的所属分类,〈guid〉为该项目定义一个唯一的标识符。通常情况下,一段item的介绍可能包含新闻的全部介绍,或者仅仅是额外的内容或者简短的介绍。这些项目的链接通常都能链接到全部的内容,可以让用户阅读网站内容的最新信息。 Rss提供网站间的内容共享,用户可以通过订阅rss在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。 一般情况下,用户也可以通过rss阅读器或者在线网络工具直接阅读rss内容。但这些应用需要用户主动寻找rss信息源,并手动添加到rss信息源到列表中,操作繁琐,数据混杂,不便于用户操作。 传统的rss订阅方式可以通过直接访问rss可以得到rss的各个元素信息,首先用户向服务器发出连接rss请求,服务器接到请求后连接因特网,因特网返回rss数据给服务器,最后服务器向用户返回数据。其步骤如下 (1)、用户向服务器发出连接请求; (2)、服务器根据用户提交的rss连接信息去因特网连接rss源; (3)、因特网向服务器返回rss数据信息; (4)、服务器向用户返回rss信息。 该方法访问速度慢,内容处理复杂,并且一旦服务器处在掉线模式,系统就不能正常运行,其可靠性大大下降,不能为用户提供优质服务。如电脑知识与技术杂志第5巻第9期,2009年3月,基于RSS的个性化信息服务研究所述即属于此列。
技术实现思路
为了克服现有技术的缺陷和不足,以解决用户直接访问rss数据存在的速度缓慢以及rss数据分类复杂混乱、操作繁琐的问题,本专利技术提供了。 本专利技术的技术解决方案是直接在内容服务器端进行rss订阅,并将来源不同的rss信息分类,整合到本地数据库,由内容服务器向用户直接提供rss服务。 本专利技术的技术解决方案如下 —种本地数据库同步更新远程rss数据的方法,步骤如下 1)内容服务器解析所有的rss源,将解析的rss信息放入本地数据库; 2)对得到的rss信息进行分类,整合到内容服务器的本地数据库; 3)内容服务器端进行rss内容更新。 上述步骤1)所述的内容服务器解析所有的rss源,将解析的rss信息放入本地数据库,具体步骤如下 (1)产生某一个rss源对应的XML—RSS对象$rss = &new XML_RSS ($url) ;url是该rss源对应的链接; (2)解析该rss源$rss->parse(); (3)得至lj该rss源的所有item :$items = $rss_>getltems (); (4)对所有的rss进行解析,并且将每一个rss源的信息都存放在数据表中,其中在本地数据库中为每一个rss源建立一个数据表,以标识不同的rss源信息。通常,我们提取item的title、description、link、pubdate元素,并且根据title4元素和description元素进行分类,通过与rss源所属的频道进行模糊匹配分类,存放于本地数据库中的不同数据表中。 上述步骤2)所述的对得到的rss信息进行分类,整合到内容服务器的本地数据库,具体步骤如下 (1)根据频道分类信息确定rss信息的分类有哪些,其中为每一个频道建立一个数据表,以标识不同的频道数据; (2)由解析得到的〈title〉、 〈description〉确定该item属于哪个分类; (3)根据得到的li本文档来自技高网
...

【技术保护点】
一种本地数据库同步更新远程rss数据的方法,步骤如下:1)内容服务器解析所有的rss源,将解析的rss信息放入本地数据库;2)对得到的rss信息进行分类,整合到内容服务器的本地数据库;3)内容服务器端进行rss内容更新。

【技术特征摘要】
一种本地数据库同步更新远程rss数据的方法,步骤如下1)内容服务器解析所有的rss源,将解析的rss信息放入本地数据库;2)对得到的rss信息进行分类,整合到内容服务器的本地数据库;3)内容服务器端进行rss内容更新。2. 如权利要求l中步骤l)所述的内容服务器解析所有的rss源,将解析的rss信息放入本地数据库,具体步骤如下(1) 产生某一个rss源对应的XML_RSS对象$rss = &new XML_RSS ($url) ;url是该rss源对应的链接;(2) 解析该rss源$rss_ > parse ();(3) 得至U该rss源的所有item :$items = $rss_ > getltems();(4) 对所有的rss源进行解析,并且将每一个rss源的信息都存放在数据表中,其中在本地数据库中为每一个rss源建立一个数据表,以标识不同的rss源信息。3. 如权利要求l中步骤2)所述的对得到的rss信息进行分类,整合到内容服务器的本地数据库,具体步骤如下(1) 根据频道分类信息确定rss信息的分类有哪些,其中为每一个频道建立一个数据表,以标识不同的频道数据;(2) 由解析得到的〈title〉、 〈description〉确定该item属于哪个分类;(3) 根据得到的link信息,得到该item的全文信息;并将该item加入到相应的分类...

【专利技术属性】
技术研发人员:袁东风颜廷芝王恒徐超林贺陈飞魏斌石祚夫
申请(专利权)人:山东大学
类型:发明
国别省市:88[中国|济南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1