数据交换所可用性、清单可见性和清单实现制造技术

技术编号:37511756 阅读:9 留言:0更新日期:2023-05-12 15:31
本文提供了用于提供安全和高效的方式来管理数据交换所的可用性和管理数据交换所的数据清单的可见性的系统和方法。例如,该方法可以包括由数据交换所的交换所管理员指定其中数据交换所可用的一组区域,该组区域中的每一个区域包括一个或更多个远程部署。该方法还可以包括由数据提供者指定其中数据提供者拥有的数据清单可见的一组区域中的一个或更多个区域。在从一个或更多个区域的远程部署接收到访问数据清单的请求时,数据提供者可以确定是拒绝还是实现该请求。响应于确定应该实现该请求,将数据清单的数据复制到远程部署。将数据清单的数据复制到远程部署。将数据清单的数据复制到远程部署。

【技术实现步骤摘要】
【国外来华专利技术】数据交换所可用性、清单可见性和清单实现
[0001]相关申请
[0002]本申请根据35U.S.C.
§
119(e)要求于2020年8月14日提交的第16/994,325号美国专利申请的利益,该美国专利申请的公开内容通过引用以其整体并入本文。


[0003]本公开涉及数据共享平台,并且尤其涉及远程部署之间数据共享平台的可用性以及远程部署之间清单(listing)的可见性/实现。
[0004]背景
[0005]包括数据库的数据共享平台广泛用于计算应用中的数据存储和访问。数据库可以包括一个或更多个表,该表包括或引用可以使用查询来读取、修改或删除的数据。数据库可以用于存储和/或访问个人信息或其他敏感信息。可以通过加密和/或以加密形式存储数据来提供对数据库数据的安全存储和访问,以防止未授权的访问。在一些情况下,可能需要数据共享以让其他方针对一组数据执行查询。
[0006]附图简述
[0007]通过参考以下结合附图的描述,可以最好地理解所描述的实施例及其优点。在不脱离所描述的实施例的精神和范围的情况下,这些附图决不限制本领域技术人员可以对所描述的实施例进行的形式和细节上的任何改变。
[0008]图1A是描绘其中可以实现本文公开的方法的示例计算环境的框图。
[0009]图1B是示出示例虚拟仓库(warehouse)的框图。
[0010]图2是根据本专利技术的实施例的可用于实现公共或私有数据交换所的数据的示意性框图。
[0011]图3是根据本专利技术的实施例的用于实现数据交换所的组件的示意性框图。
[0012]图4A是根据本专利技术的一些实施例的在数据交换所(data exchange)中的远程部署的框图。
[0013]图4B是根据本专利技术的一些实施例的在数据交换所中的远程部署的框图。
[0014]图5是根据本专利技术的一些实施例的在数据交换所中的远程部署的框图。
[0015]图6是根据本专利技术的一些实施例的在数据交换所中的远程部署的框图。
[0016]图7是根据本专利技术的一些实施例的用于管理数据交换所可用性和数据清单可见性的方法的流程图。
[0017]图8是根据本专利技术的一些实施例的用于管理清单批准请求的方法的流程图。
[0018]图9是根据本专利技术的一些实施例的示例计算设备的框图,该示例计算设备可以执行本文描述的一个或更多个操作。
[0019]详细描述
[0020]数据提供者经常拥有难以共享的数据资产。数据资产可以是另一实体感兴趣的数据。例如,一个大型在线零售公司可能有包括过去十年中数百万顾客的购买习惯的数据集。这个数据集可能很大。如果在线零售商希望与另一实体共享该数据的全部或部分(根据适
用的隐私法和合同义务,匿名和/或聚合),在线零售商可能需要使用旧的和缓慢的方法来传输数据,例如文件传输协议(FTP),或者甚至将数据复制到物理媒体上并将物理媒体邮寄给另一实体。这有几个缺点。首先,它很慢。复制兆兆字节(terabytes)或千万亿字节(petabytes)的数据可能需要几天的时间。其次,一旦传递了数据,共享者就无法控制数据发生了什么。接收方可以更改数据,进行复制或与其他方共享。再次,唯一有兴趣以此类方式访问如此大数据集的实体是大型公司,该公司可以负担得起传送和处理数据的复杂后勤工作,以及此类麻烦的数据传送的高昂价格。因此,较小的实体(例如,中小型企业(SMB)、“夫妻店”等),或者甚至更小、更灵活的云理念初创企业(cloud

focused startup),往往由于价格过高而无法访问这些数据,尽管这些数据可能对他们的企业很有价值。这可能是因为原始数据资产通常过于粗糙,并且充满了潜在的敏感数据,无法直接出售给其它公司。数据拥有者必须先进行数据清理、取消标识、聚合、连接和其他形式的数据充实,然后才能与另一方共享。这既费时又昂贵。最后,由于上述原因,传统的数据共享方法不允许可扩展的共享,因此很难与许多实体共享数据资产。传统的共享方法还会给所有访问最近更新的数据的各方带来时延和延迟。
[0021]私有数据交换所和公共数据交换所可以使数据提供者更容易且更安全地与其他实体共享其数据资产。公共数据交换所(本文也称为“雪花数据市场(Snowflake data marketplace)”或“数据市场(data marketplace)”)可以提供开放访问的集中存储库,其中数据提供者可以向成千上万的客户发布和控制实时和只读数据集。私有数据交换所(本文也称为“数据交换所”)可以在数据提供者的品牌下,并且数据提供者可以控制谁可以获得对数据的访问权。数据交换所可以仅供内部使用,或者也可以向客户、合作伙伴、供应商或其他人开放。数据提供者可以控制列出哪些数据资产,以及控制谁可以访问哪些数据集。这允许无缝的方式来发现和共享数据提供者的组织内及其业务伙伴的数据。
[0022]数据交换所可以通过诸如的云计算服务来促进,并允许数据提供者直接从他们自己的在线域(例如,网站)在一个具有其自己品牌的私有在线市场上提供数据资产。数据交换所可以为实体提供集中式的、受管理的中心,以列出内部或外部共享的数据资产,激发数据协作,并且还维护数据治理和审计访问。通过数据交换所,数据提供者能够在公司之间共享数据而不复制数据。数据提供者可以邀请其他实体查看其数据清单,控制哪些数据清单出现在其私有在线市场中,控制谁可以访问数据清单以及其他人如何可与连接到该清单的数据资产进行交互。可以将其视为“围墙花园”市场,在该市场中,进入花园的游客必须得到批准,并且某些清单的访问可以受到限制。
[0023]例如,公司A可以是一家消费者数据公司,该消费者数据公司已经收集并分析了数个不同类别中数百万个人的消费习惯。他们的数据集可以包括以下类别的数据:在线购物、视频流、电力消耗、汽车使用、互联网使用、服装购买、移动应用购买、俱乐部会员资格和在线订阅服务。公司A可能希望向其他实体提供这些数据集(或这些数据集的子集或派生产品)。例如,新的服装品牌可能希望访问与消费者服装购买和在线购物习惯有关的数据集。A公司可以在其网站上支持一个页面,该页面是或功能基本上类似于数据交换所,在该页面上,数据消费者(例如,新服装品牌)可以直接从A公司浏览、探索、发现、访问和有可能购买数据集。此外,A公司可以控制:谁可以进入数据交换所、可以查看特定清单的实体、实体可以对清单采取的动作(例如,仅查看)以及任何其他适当的动作。此外,数据提供者可以将其
自己的数据与来自例如公共数据交换所(也称为“雪花数据市场”或“数据市场”)的其他数据集组合,并使用组合的数据创建新的清单。
[0024]数据交换所可以是发现、汇集、清理和丰富数据以使其更加富有价值的适当场所。数据交换所上的一个大公司可以汇集来自其各个分支和部门的可能对另一个公司有价值的数据。此外,私有生态系统数据交换所的参与者可以一起工作,以将其数据集连接在一起,共同创建他们当中任何一方都无法单独生产的有用数据产品。这些关联本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:指定其中数据交换所是可用的一组区域,所述一组区域中的每一个区域包括一个或更多个远程部署;指定其中数据清单是可见的所述一组区域中的一个或更多个区域;响应于从所述一个或更多个区域的远程部署接收到访问所述数据清单的请求,确定是拒绝还是实现所述请求;以及响应于确定实现所述请求,由处理设备将所述数据清单的数据复制到所述远程部署。2.根据权利要求1所述的方法,其中,指定所述多个区域包括:利用包括所述一组区域中的每一个区域的位置标识符的字符串修改所述数据交换所的数据处理对象。3.根据权利要求2所述的方法,还包括:解析所述字符串以确定其中所述数据交换所是可用的所述一组区域;从其中所述数据交换所将是可用的所述一组区域中的每一个区域获得每个远程部署;以及将所述数据交换所复制到其中所述数据交换所将是可用的所述一组区域中的每一个区域中的每个远程部署。4.根据权利要求1所述的方法,其中,指定所述一组区域中的所述一个或更多个区域包括:利用包括所述一个或更多个区域中的每一个区域的位置标识符的字符串修改所述数据交换所的数据处理对象。5.根据权利要求4所述的方法,还包括:解析所述字符串以确定其中所述数据清单将是可见的所述一个或更多个区域;从其中所述数据清单将是可见的所述一个或更多个区域中的每一个区域获得每个远程部署;以及将所述数据清单复制到其中所述数据清单将是可见的所述一个或更多个区域中的每一个区域中的每个远程部署。6.根据权利要求3所述的方法,其中,将所述数据交换所复制到远程部署包括:生成所述数据交换所的全局表示;将所述数据交换所的元数据复制到所述远程部署;以及基于所述全局表示在所述远程部署上创建所述数据交换所的本地副本。7.根据权利要求1所述的方法,其中,来自所述远程部署的访问所述数据清单的所述请求包括用于管理向数据提供者提出的访问数据清单的请求的全局消息,并且其中,所述全局消息利用所述请求的信息更新所述数据交换所的数据处理对象。8.根据权利要求1所述的方法,还包括接收关于交换所管理员批准发布所述数据清单的请求。9.根据权利要求8所述的方法,其中,关于交换所管理员批准发布所述数据清单的所述请求包括用于管理由数据提供者对批准发布数据清单的请求的全局消息,并且其中,所述全局消息利用所述请求的信息更新所述交换所管理员被托管的远程部署的数据处理对象。10.根据权利要求4所述的方法,还包括:
通过向所述字符串添加一个或更多个新的位置标识符或从所述字符串中移除所述位置标识符中的一个或更多个位置标识符来修改其中所述数据清单是可见的所述一组区域中的所述一个或更多个区域。11.一种系统,包括:存储器;以及能够操作地耦合到所述存储器的处理设备,所述处理设备用于:指定其中数据交换所是可用的一组区域,所述一组区域中的每一个区域包括一个或更多个远程部署;指定其中数据清单是可见的所述一组区域中的一个或更多个区域;响应于从所述一个或更多个区域的远程部署接收到访问所述数据清单的请求,确定是拒绝还是实现所述请求;以及响应于确定实现所述请求,将所述数据清单的数据复制到所述远程部署。12.根据权利要求11所述的系统,其中,指定所述多个区域包括:利用包括所述一组区域中的每一个区域的位置标识符的字符串修改所述数据交换所的数据处理对象。13.根据权利要求12所述的系统,其中,所述处理设备还用于:解析所述字符串以确定其中所述数据交换所是可用的所述一组区域;从其中所述数据交换所将是可用的所述一组区域中的每一个区域获得每个远程部署;以及将所述数据交换所复制到其中所述数据交换所将是可用的所述一组区域中的每一个区域中的每个远程部署。14.根据权利要求11所述的系统,其中,为了指定所述一组区域中的所述一个或更多个区域,所述处理设备用于:利用包括所述一个或更多个区域中的每一个区域的位置标识符的字符串修改所述数据交换所的数据处理对象。15.根据权利要求14所述的系统,其中,所述处理设备还用于:解析所述字符串以确定其中所述数据清单将是可见的所述一个或更多个区域;从其中所述数据清单将是可见的所述一个或更多个区域中的每一个区域获得每个远程部署;以及将所述数据清单复制到其中所述数据清单将是可见的所述一个或更多个区域中的每一个区域中的每个远程部署。16.根据权利要求13所述的系统...

【专利技术属性】
技术研发人员:朱培基本诺特
申请(专利权)人:斯诺弗雷克公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1