中云开源数据技术上海有限公司专利技术

中云开源数据技术上海有限公司共有28项专利

  • 本发明公开了一种去中心化分布式共生共享的数据编织系统,包括如下步骤:1)构建基础支撑平台DataFabric;2)通过ApacheKafka,建立一个异步数据摄取流程,从多种数据源摄取/接收数据;3)数据抽取、转换和加载;4)元数据管理...
  • 本发明公开了一种基于人工智能的产业数据管理和共享平台,包括包括如下步骤:基于数据湖构建数据管理平台;在所述数据管理平台的基础上创建工业数据空间iDS3;对数据源进行数据摄取;将数据导入到工业数据空间iDS3中,进行数据的统一管理;在工业...
  • 本发明公开了一种具有用户个性化特征的情感分类方法,其特征在于,包括如下步骤:1)收集用户的评论文本数据,并基于评论文本数据构建具有用户个性化特征的情感分类模型;2)确定情感分类模型中需要优化的参数,并进行多核形式的模型等价变换;3)对模...
  • 本发明公开了一种面向旋转机械的类别不平衡故障诊断方法,包括如下步骤:1)获取旋转机械的振动信号,分别从时域、频域和时频域三个角度抽取原始振动信号中的统计特征,得到多视图故障特征;用元学习设置自步学习的参数,实现自步学习的最佳优化,并通过...
  • 本发明公开了一种基于异构分类器的堆叠泛化方法,包括如下步骤:首先构建堆叠泛化框架、循环神经网络个体分类器和基于浅层学习的NB
  • 本发明公开了一种基于雾计算架构的工业物联网设备故障检测方法,包括工业物联网设备、边缘网关和雾服务器;雾服务器具有数据预处理子模块、特征提取子模块和故障分类子模块;雾服务器通过边缘网关接收到工业物联网设备的运行数据后,数据预处理子模块对相...
  • 本发明公开了一种基于数字孪生的故障诊断方法,包括如下步骤:1)基于物理模型的物理特性,构建其对应的虚拟模型;2)分别运行物理模型和虚拟模型,获取若干种特征的实测值和虚拟值;3)基于距离度量方法选择需要优化的参数,然后用粒子群优化算法对数...
  • 本发明公开了一种基于词共现图和锚词抽取的短文本主题层次挖掘方法,包括如下步骤:S1.主题层次挖掘框架首先基于词共现图实现主题推断和锚词抽取;然后,应用关联规则挖掘频繁锚词短语;S2.采用概率排序函数量化锚词短语的覆盖面、短语化与纯度等标...
  • 本发明公开了一种基于深度稀疏自动编码器的两阶段集成故障诊断模型,包括如下步骤:1)首先采用不同类型的激活函数训练出具有不同学习行为的稀疏自动编码器,然后用堆叠方法将稀疏自动编码器构建为多个不同的深度稀疏自动编码器;2)对深度稀疏自动编码...
  • 本发明公开了一种应用于制造业科学技术文档的命名实体识别模型,其网络结构包括词嵌入层SciBERT,其用于将输入的词转换为固定长度的向量;BiLSTM层,其利用文本序列的上下文信息挖掘隐藏特征,其用于编码文本;注意力层,其用于降低实体内部...
  • 本发明是一种基于数据湖服务器的算法配置组合平台,包含:数据目录区,数据预处理工作台,数据预处理资源目录区,通用算法操作目录区,算法流程工作台,模型资源目录区,知识库;其操作方法包含:步骤1、在一个数据湖服务器节点,进入算法配置组合平台;...
  • 一种对数据湖服务器中的数据进行管理和访问的方法,每台数据湖服务器看作一个数据湖服务器节点,所有的数据湖服务器节点之间相互连接,形成网状拓扑结构。数据拥有者登录任意一个数据湖服务器节点,进行数据接入操作、访问以及数据维护操作。本发明提供多...
  • 本发明公开一种多源异构数据导入数据湖的方法,包含:获取外部的文件型数据的访问接口地址,导入该文件型数据并保存到本地数据湖服务器的分布式文件系统;或获取外部数据源的访问接口信息,将其与本地数据湖服务器连接,导入外部数据源的数据并以数据文件...
  • 本发明涉及一种对等式数据运算与存储架构构建方法,多个数据湖服务器节点构成权限对等的拓扑结构;每一个数据湖服务器作为一个节点,采用分布式运算和存储架构,支持对关系型数据库数据、文档型数据库数据、文件型数据以及图数据的存储和管理;节点内部用...
  • 本发明公开了一种多源异构数据的语义数据湖构建方法,包含以下步骤:S1、构建本体,确认本体的属性和参数,存到数据湖服务器的图数据库中;S2、提取导入的数据文件的内容的语义,建立RDF描述,并将建立好的RDF描述保存到数据湖服务器的文档型数...
  • 本发明提供一种基于数据湖服务器的数据可视化编辑展示平台,用于可视化处理数据源并生成网页,包含图形化界面的数据目录区、数据处理区、图表资源目录区和报表页面工作区。用户上传的数据源经所述平台自动分类存入不同的数据库,并在数据目录区中形成数据...
  • 本发明公开了一种算法应用管理平台,其集成了若干算法的算法实现层、算法支持层和算法存储层;所述的算法支持层与算法实现层之间通过标准接口进行交互,所述的算法支持层用于对算法进行组合形成新业务所需的算法;所述的算法存储层用于各类挂载于算法应用...
  • 本发明公开一种海量数据集分析和展示的交互式系统及其方法,包含:S1、自动提取新加入数据集的元数据;每一个新加入数据集都含有对数据集描述的元数据;S2、对所有的数据集的元数据进行汇总分析,将新加入数据集的元数据信息更新到原有数据集的概要信...
  • 本发明提供一种生产设备故障预测诊断方法,包含步骤:S1、采集生产设备的M类历史工作数据Vi和M类实时工作数据Si,i∈[1,M];S2、清洗、预处理Vi、Si;S3、整秒采样Vi、Si,建立对应的整秒采样数据集Vi′、Si′;S4、通过...
  • 本发明公开了一种离散数据的可视化方法,包括以下步骤,S1)获取数据集的各条数据信息;S2)根据所获数据信息中的变量属性,确定所需显示的必要变量属性;S3)赋予每一所述必要变量属性一显示维度,其中至少一个所述必要变量属性为离散型数据属性;...