结构化数据交互系统、数据接收端和结构化数据交互方法技术方案

技术编号:9596812 阅读:120 留言:0更新日期:2014-01-23 02:18
本发明专利技术公开了一种结构化数据交互系统、数据接收端和结构化数据交互方法。系统包括:包括,数据发送端、数据接收端和至少一个数据展示平台:数据发送端用于向数据接收端发送预定格式的结构化数据,接收数据接收端发送的反馈信息;数据接收端用于接收并存储结构化数据,向数据展示平台推送存储的结构化数据,统计数据展示平台对推送的结构化数据的收录情况,根据收录情况,发送相应地收录反馈信息至数据发送端;数据展示平台用于展示收录的结构化数据。本发明专利技术使得数据发送方在主动提交数据的同时,能够获取提交的数据使用反馈信息,方便数据发送方了解主动提交的数据的使用情况,便于数据发送方及时合理的修正提交的数据。

【技术实现步骤摘要】
结构化数据交互系统、数据接收端和结构化数据交互方法
本专利技术涉及通信技术和计算机领域,尤其涉及一种数据交互系统、数据接收端和数据交互方法。
技术介绍
随着互联网技术的飞速发展,网络信息迅速成为人们获取信息的主要渠道之一。互联网在将人类可以获取的几乎所有知识纳入其中的同时,也给资源的使用者和提供者带来了巨大压力。搜索引擎正是在这一压力下应运而生,它用来协助互联网用户在互联网中更加有效的查找信息。具体地,搜索引擎根据一定的策略、运用特定的计算机程序从互联网上搜索信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户。目前,世界上的搜索引擎所使用的技术主要包括以下三个功能模块:(1)爬网;(2)分词索引;(3)搜索。爬网是将全世界的网站网页尽可能多的抓取到自己的服务器中存起来,然后通过一定的方法进行分词检索,最后通过大量的服务器阵列来对应大量的搜索请求。这三个功能模块也被称为搜索引擎的信息求取技术。在信息求取技术中,搜索引擎主要通过调动、被动拉取的方式,从外部获取数据,该方式主要存在以下问题:(1)需要考虑外部数据站点可承受的抓取压力;(2)需要优化调度策略,技术成本比较高;(3)数据一旦变化而调度不及时,容易有漏抓,造成数据内容未及时获取而丢失;(4)不管数据是否变化,均需要通过抓取来检测,对站点造成抓取压力;(5)站点提供的数据,搜索引擎可以抓取,其他用户也可以抓取,数据的保密性无法保证;(6)站点需要对搜索引擎的抓取做白名单,需要了解搜索引擎网爬的UA(UserAgent,用户代理)以及抓取IP(InternetProtocol,网络互连协议)地址,有一定的成本;(7)通过调度进行抓取,在时效性上会有一定的延迟;(8)对站点来说,数据的提供是不可控的,当站点不希望提供某些数据时,只能通过做数据删除或者UA封禁的方式来解决。针对上述技术问题,现有技术提出一种用户自动上传结构化数据的方式,主要思想是让数据的提供方主动提供数据给搜索引擎,这种数据提供方式目前是基于XML-RPC(XMLRemoteProcedureCall,XML远程方法调用)协议实现的,需要按照XML-RPC的协议标准构造结构化数据包,该结构化数据包结构复杂,用户的使用成本很高,有一定的开发成本;同时,现有技术提供的主动提交方式没有安全机制,无法保证某一数据方提交的数据确实是来自于该数据方的数据;另外,现有技术提供的主动提交方式没有反馈机制,数据方无法获取主动提交的数据在搜索引擎内部的使用情况,无法根据反馈信息修正自身的数据。
技术实现思路
有鉴于此,本专利技术提供一种结构化数据交互系统、数据接收端和结构化数据交互方法,使得数据发送方在主动提交数据的同时,能够获取提交数据的使用反馈信息,方便数据发送方了解主动提交的数据的使用情况,便于数据发送方及时、合理的修正提交的数据。在第一方面,本专利技术实施例提供了一种结构化数据交互系统,包括,数据发送端、数据接收端和至少一个数据展示平台:所述数据发送端用于向数据接收端发送预定格式的结构化数据,接收所述数据接收端发送的反馈信息,所述反馈信息中包括收录反馈信息;所述数据接收端用于接收所述结构化数据,存储所述结构化数据,向所述数据展示平台推送存储的结构化数据,统计所述数据展示平台对推送的结构化数据的收录情况,根据所述收录情况,发送相应地收录反馈信息至所述数据发送端;所述数据展示平台用于展示收录的结构化数据。在第二方面,本专利技术实施例提供了一种数据接收端,包括:数据接收单元,用于接收数据发送端发送的结构化数据;数据存储单元,用于存储所述结构化数据,数据推送单元,用于向数据展示平台推送存储的结构化数据;数据统计单元,用于统计所述数据展示平台对推送的结构化数据的收录情况;收录反馈发送单元,用于根据所述收录情况,发送相应地收录反馈信息至所述数据发送端。在第三方面,本专利技术实施例提供了一种数据交互方法,包括:一种数据交互方法,其特征在于,包括:接收数据发送端发送的结构化数据;存储所述结构化数据,向数据展示平台推送存储的结构化数据;统计所述数据展示平台对推送的结构化数据的收录情况;根据所述收录情况,发送相应地收录反馈信息至所述数据发送端。本专利技术实施例通过在数据发送方主动提交数据的系统中引入反馈机制,使得数据发送方在主动提交数据的同时,能够获取提交数据的使用反馈信息,方便数据发送方了解主动提交的数据的使用情况,既实现了数据接收方对实时更新的结构化数据的及时获取,又方便了数据发送方及时、合理的修正提交的数据。附图说明图1是本专利技术第一实施例的结构化数据交互系统的示意图;图2是某招聘网站中一个网页的显示信息的示意图;图3是本专利技术第一实施例的一种结构化数据在网页展示平台的展示结果示意图;图4是本专利技术第一实施例的一种结构化数据在视频展示平台展示结果示意图;图5是本专利技术优选实施方式的一种数据发送端和数据接收端按照预定的安全机制进行交换的示意图;图6是本专利技术优选实施方式的一种反馈信息的发送示意图;图7是本专利技术第二实施例的一种结构化数据交互系统的示意图;图8是本专利技术第三实施例的一种结构化数据交互方法的流程图;图9是本专利技术方案的一种应用场景的示意图;图10是可用于实施本专利技术方案的服务器的结构示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。第一实施例图1是本专利技术第一实施例的数据交互系统的示意图。如图1所示,结构化数据交互系统10包括:数据发送端11、数据接收端12和至少一个数据展示平台13。其中,数据发送端11和数据接收端12通过有线或者无线数据网络连接。以上所述通过有线或者无线数据网络连接是指数据接收端12可以通过网络即时地接收数据发送端11发送的消息,或者,数据接收端12可以通过网络间接地、非即时地(例如,通过消息存储服务器中转)接收数据发送端11发送的消息。其中,数据发送端11用于向数据接收端12发送结构化数据;接收数据接收端12发送的反馈信息,所述反馈信息中包括收录反馈信息。在本实施例中,数据发送端11的数据提供者为一些行业网站的站长。当然本领域人员应该理解,数据发送端的数据提供者可以为任何组织或者任何个人,对此并不限定。结构化数据为行数据,是可以用二维表结构来逻辑表达实现的数据。互联网中的各类网站数据信息均可以按照预定的规则以结构化数据的形式表示,网站资源可以通过结构化数据的形式推送至互联网,供用户进行访问。在本实施例中,行业站长将网站中的数据按照结构化数据的格式规范构造相应的结构化数据包,向数据接收端12发送相应的结构化数据。在本实施例中,数据发送端11可以按照国际通用的协议标准(例如:XML-RPC协议或者HTTP协议等)构造结构化数据包发送至数据接收端12,也可以按照收发双方约定的数据格式构造结构化数据包发送至数据接收端12。图2所示的某招聘网站中一个网页的显示信息,该网页对应的结构化数据示意图如表1所示。表1优选的,当网站的结构化数据进行更新后,数据提供者通过数据发送端11向数本文档来自技高网
...
结构化数据交互系统、数据接收端和结构化数据交互方法

【技术保护点】
一种结构化数据交互系统,其特征在于,包括,数据发送端、数据接收端和至少一个数据展示平台:所述数据发送端用于向数据接收端发送预定格式的结构化数据,接收所述数据接收端发送的反馈信息,所述反馈信息包括收录反馈信息;所述数据接收端用于接收所述结构化数据,存储所述结构化数据,向所述数据展示平台推送存储的结构化数据,统计所述数据展示平台对推送的结构化数据的收录情况,根据所述收录情况,发送相应的收录反馈信息至所述数据发送端;所述数据展示平台用于展示收录的结构化数据。

【技术特征摘要】
1.一种结构化数据交互系统,其特征在于,包括,数据发送端、数据接收端和至少一个数据展示平台:所述数据发送端用于向数据接收端发送预定格式的结构化数据,接收所述数据接收端发送的反馈信息,所述反馈信息包括收录反馈信息;所述数据接收端用于接收所述结构化数据,存储所述结构化数据,向所述数据展示平台推送存储的结构化数据,统计所述数据展示平台对推送的结构化数据的收录情况,根据所述收录情况,发送相应的收录反馈信息至所述数据发送端;所述数据展示平台用于展示收录的结构化数据;其中,所述数据接收端为搜索引擎的服务器。2.根据权利要求1所述的结构化数据交互系统,其特征在于,所述数据接收端用于在接收所述结构化数据之后,校验所述结构化数据的合法性,并存储校验合法的结构化数据。3.根据权利要求1或2所述的结构化数据交互系统,其特征在于,所述存储所述结构化数据进一步包括,根据接收的结构化数据的数据类型,存储带类型标签的结构化数据。4.根据权利要求3所述的结构化数据交互系统,其特征在于,所述向所述数据展示平台推送存储的结构化数据包括:在所述数据接收端存储所述结构化数据之后,向所述数据展示平台推送该存储的结构化数据。5.根据权利要求4所述的结构化数据交互系统,其特征在于,所述向所述数据展示平台推送所述结构化数据进一步包括,所述数据接收端根据存储的结构化数据的类型标签,向对应的数据展示平台推送所述存储的结构化数据。6.根据权利要求3所述的结构化数据交互系统,其特征在于,所述向所述数据展示平台推送存储的结构化数据包括:在所述数据接收端接收到所述数据展示平台发送的数据下载请求时,向所述数据展示平台推送存储的结构化数据。7.一种数据接收端,其特征在于,包括:数据接收单元,用于接收数据发送端发送的结构化数据;数据存储单元,用于存储所述结构化数据;数据推送单元,用于向数据展示平台推送存储的结构化数据;数据统计单元,用于统计所述数据展示平台对推送的结构化数据的收录情况;收录反馈发送单元,用于根据所述收录情况,发送相应地收录反馈信息至所述数据发送端;其中,所述数据接收端为搜索引擎的服务器。8.根据权利要求7所述的数据接收端,其特征在于,所述数据接...

【专利技术属性】
技术研发人员:糜利敏祝洪凯曹中宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1