用于自动映射与数据流环境一起使用的数据类型的系统和方法技术方案

技术编号:19268224 阅读:52 留言:0更新日期:2018-10-27 05:02
根据各种实施例,本文描述的是用于与利用机器学习(ML、DataFlow机器学习、DFML)的数据集成或其它计算环境一起使用的、用于管理数据流(dataflow、DF)以及构建复杂的数据流软件应用(数据流应用,流水线)的系统(数据人工智能系统、数据AI系统)。根据实施例,该系统可以提供对一个或多个数据源或数据目标(在本文中在一些实施例中称为HUB)之间的复杂数据结构、数据集或实体的自动映射的支持。自动映射可以由数据集的元数据、模式和统计剖析驱动;并且用于将与输入HUB相关联的源数据集或实体映射到目标数据集或实体,或反之亦然,以产生以一格式或组织(投影)准备的与一个或多个输出HUB一起使用的输出数据。

【技术实现步骤摘要】
【国外来华专利技术】用于自动映射与数据流环境一起使用的数据类型的系统和方法版权声明本专利文档的公开内容的一部分包含受版权保护的素材。版权拥有者不反对任何人对专利文档或专利公开内容按照在专利商标局的专利文件或记录中出现的那样进行传真复制,但是除此之外在任何情况下都保留所有版权。优先权要求:本申请要求于2016年8月22日提交的申请号为62/378,143,标题为“SYSTEMANDMETHODFORAUTOMATEDMAPPINGOFDATATYPESBETWEENCLOUDANDDATABASESERVICES”;于2016年8月22日提交的申请号为62/378,146,标题为“SYSTEMANDMETHODFORDYNAMIC,INCREMENTALRECOMMENDATIONSWITHINREAL-TIMEVISUALSIMULATION”;于2016年8月22日提交的申请号为62/378,147,标题为“SYSTEMANDMETHODFORINFERENCINGOFDATATRANSFORMATIONSTHROUGHPATTERNDECOMPOSITION”;于2016年8月22日提交的申请号为62本文档来自技高网...

【技术保护点】
1.一种与数据集成或其它计算环境一起使用的方法,包括:处理访问的数据,以对所访问的数据执行元数据分析;识别所访问的数据的一个或多个样本;应用机器学习过程来确定所访问的数据内的数据的类别;以及基于所确定的数据的类别来生成所访问的数据的简档,以用于自动映射所访问的数据。

【技术特征摘要】
【国外来华专利技术】2016.08.22 US 62/378,143;2016.08.22 US 62/378,146;1.一种与数据集成或其它计算环境一起使用的方法,包括:处理访问的数据,以对所访问的数据执行元数据分析;识别所访问的数据的一个或多个样本;应用机器学习过程来确定所访问的数据内的数据的类别;以及基于所确定的数据的类别来生成所访问的数据的简档,以用于自动映射所访问的数据。2.如权利要求1所述的方法,其中所述简档被生成以用于将所访问的数据变换成数据仓库。3.如权利要求1或2所述的方法,还包括在图形用户界面中显示所述简档,以用于创建数据流应用。4.如权利要求3所述的方法,其中推荐被过滤和排序并被传递给所述图形用户界面。5.如权利要求1至4中任一项所述的方法,其中,在处理所访问的数据期间,确定对所访问的数据启用的语义动作中的选择的语义动作的列表。6.如权利要求1至5中任一项所述的方法,其中计算一个或多个逻辑回归或其它模型,以表示候选数据集或实体与输入数据集或实体如何相似的总体置信度。7.如权利要求1至6中任一项所述的方法,其中所述方法在云或基于云的计算环境中执行。8.一种用于自动映射复杂数据结构、数据集或实体的系统,所述系统用于与数据集成或其它计算环境一起使用,所述系统包括:一个或多个处理器,能够操作以:处理访问的数据,以对所访问的数据执行元数据分析;识别所访问的数据的一个或多个样本;应用机器学习过程,以确定所访问的数据内的数据的类别;以及基于所确定的数据的类别来生成所访问的数据的简档,以用于自动映射所访问的数据。9.如权利要求8所述的系统,其中所述简档被生成以用于将所访问的数据变换成数据仓库。10.如权利要求8或9所述的系统,还包括图形用户界面,所述图形用户界面用于创建数据流应用。11.如权利要求10所述的系统,其中推荐被过滤和排序并被传递给所述图形用户界面。12.如权利...

【专利技术属性】
技术研发人员:H·H·纳玛瓦尔A·S·斯托贾诺维克D·阿兰G·西萨拉曼
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1