数据分析装置和方法制造方法及图纸

技术编号:10786828 阅读:114 留言:0更新日期:2014-12-17 13:46
本发明专利技术涉及对由不同种类的传感器测量的测量值即不同种类数据进行综合而产生群组的装置和方法。本发明专利技术一实施例的不同种类数据群组产生装置可包括:接收部,接收由第一传感器测量的第一时间序列数据和由与第一传感器不同种类的传感器即第二传感器测量的第二时间序列数据;数据合并部,利用第一时间序列数据和第二时间序列数据来产生包括一个以上的顺序对的顺序对组,顺序对由第一时间序列数据的与特定时刻对应的测量值和第二时间序列数据的与特定时刻对应的测量值构成;和群组产生部,利用顺序对组来产生群组,顺序对组以在包括表示第一时间序列数据的测量值的第一轴和表示第二时间序列数据的测量值的第二轴而构成的坐标系上的位置为基准对应。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及对由不同种类的传感器测量的测量值即不同种类数据进行综合而产生群组的装置和方法。本专利技术一实施例的不同种类数据群组产生装置可包括:接收部,接收由第一传感器测量的第一时间序列数据和由与第一传感器不同种类的传感器即第二传感器测量的第二时间序列数据;数据合并部,利用第一时间序列数据和第二时间序列数据来产生包括一个以上的顺序对的顺序对组,顺序对由第一时间序列数据的与特定时刻对应的测量值和第二时间序列数据的与特定时刻对应的测量值构成;和群组产生部,利用顺序对组来产生群组,顺序对组以在包括表示第一时间序列数据的测量值的第一轴和表示第二时间序列数据的测量值的第二轴而构成的坐标系上的位:置为基准对应。【专利说明】
本专利技术涉及不同种类数据群组产生装置和方法以及数据聚类方法和装置。更具体 而言,本专利技术涉及将不同传感器所测量的数据区分为几组的数据聚类方法和装置。
技术介绍
群组(Cluster)意味着在许多数据中收集类似数据作为一个对象。聚类 (Clustering)意味着在许多数据中将类似数据分类为几组。 基于K-Means、K-Medoids、Canopy等现有群组的聚类方法,如果输入新数据则分 别与所有群组进行距离运算,找到与输入数据距离最近的群组,聚类到所述群组中。 但是,这种聚类方法存在随着数据大小的变大而群组的个数会变多、运算量会显 著增加的问题。为了克服这种问题,如果减少群组的个数,则存在会丢失原有数据所具有的 特性信息而精确的数据诊断变得困难的限制。 在现有聚类方法中,利用K-D Tree这样的阶层式算法的聚类方法不需要对所有群 组进行距离运算,但如果维数N比10大,则对于空间所要探索的节点的个数会按几何级数 地增加而运算变慢。并且,K-D Tree这样的阶层式算法没有被平衡,从而存在为了调节节 点之间的平衡,需要周期性地进行重新排序的问题。 另外,存在有通过现有聚类方法无法有效地聚类的散乱数据,当通过现有聚类方 法聚类这种数据时,会出现每次不同的聚类结果。因此,存在如果通过现有聚类方法对散乱 数据进行聚类则在进行聚类时重聚类(Re-Clustering)的情况会变多而运算量会增加的 问题。 另外,当为了减少运算量而利用缩小数据维数的技术时,产生数据的信息损失,存 在无法识别缩小的维数的离群值(Outlier)数据而精确聚类会变得困难的问题。 此外,如建筑能源管理系统(BEMS,Building Energy Management System)那样, 通过不同的许多种类的传感器测量多种数据的情况会增加,但不存在对不同的许多种类的 传感器中所测量的多种数据进行综合而产生群组的技术。而且,也不存在能够对持续测量 的不同的许多种类的传感器中所测量的多种数据快速、有效地进行聚类的技术。这种状况 是因为如上所述如BEMS中通过不同的许多种类的传感器测量的数据为大容量且为散乱数 据,难以进行迅速、精确的聚类。因此,需要综合多种不同的数据而产生群组的技术和能够 对新输入的多种数据有效地进行聚类的技术。
技术实现思路
本专利技术所要解决的技术问题在于对通过不同种类的传感器测量的测量值即不同 种类数据进行综合而产生群组的装置和方法。 本专利技术所要解决的另一技术问题在于,以能够对多维数据、大容量的数据或散乱 数据有效地进行聚类的方式设定索引来产生群组的装置和方法。 本专利技术所要解决的另一技术问题在于,利用索引来检测新输入的数据的位置,从 而与现有聚类方法相比,减少运算量而有效地进行聚类的装置和方法。而且,本专利技术所要解 决的技术问题在于,在大容量数据的聚类时更有效地应用的装置和方法。 本专利技术所要解决的另一技术问题在于,利用索引来检测新输入的数据的位置,从 而对通过现有聚类方法无法有效地聚类的散乱数据进行有效的聚类的装置和方法。 本专利技术的技术问题并不限于以上提及的技术问题,并且未提及的另外的技术问题 从下述记载来看对于本领域技术人员能够明确理解。 用于实现所述技术问题的本专利技术的第一方式的不同种类数据群组产生装置,可以 包括:接收部,接收由第一传感器测量的第一时间序列数据和由与所述第一传感器不同种 类的传感器即第二传感器测量的第二时间序列数据;数据合并部,利用所述第一时间序列 数据和所述第二时间序列数据来产生顺序对组,所述顺序对组包括一个以上的顺序对而产 生,所述顺序对由所述第一时间序列数据的与特定时刻对应的测量值和与所述第二时间序 列数据的与所述特定时刻对应的测量值构成;和群组产生部,利用所述顺序对组而产生群 组,所述顺序对组以在包括表示所述第一时间序列数据的测量值的第一轴和表示所述第二 时间序列数据的测量值的第二轴而构成的坐标系上的位置为基准对应。 所述群组产生部还可以包括:索引设定部,将所述第一时间序列数据中的最小值 和最大值设定为所述第一轴的最小值和最大值,将在所述第二时间序列数据中的最小值和 最大值设定为所述第二轴的最小值和最大值,根据已设定的分辨率(Sensitivity)来分割 包括所述第一轴和所述第二轴而构成的坐标系,以产生格子型分割坐标系,对每个所述格 子型分割坐标系设定不同的索引(Index)。 所述不同种类数据群组产生装置还可以包括:归一化部,计算所述第一时间序列 数据的均值和方差以及所述第二时间序列数据的均值和方差,利用所述计算出的第一时间 序列数据的均值和方差对所述第一时间序列数据进行归一化(Normalization),利用计算 出的第二时间序列数据的均值和方差对所述第二时间序列数据进行归一化;和索引设定 部,将经归一化的第一时间序列数据中的最小值和最大值分别设定为所述第一轴的最小值 和最大值,将经归一化的第二时间序列数据中的最小值和最大值分别设定为所述第二轴的 最小值和最大值,根据已设定的分辨率(Sensitivity)来分割包括所述第一轴和所述第二 轴而构成的坐标系以产生格子型分割坐标系,并且对每个格子型分割坐标系设定不同的索 引(Index)。 根据一实施例,所述数据合并部利用所述经归一化的第一时间序列数据和所述经 归一化的第二时间序列数据来产生经归一化的顺序对组,所述经归一化的顺序对组包括一 个以上的经归一化的顺序对而产生,所述经归一化的顺序对由对所述第一时间序列数据的 与特定时刻对应的测量值进行归一化的值和对所述第二时间序列数据的与所述特定时刻 对应的测量值进行归一化的值构成,所述群组产生部可以利用所述经归一化的顺序对组来 产生群组,所述经归一化的顺序对组以在包括表示所述经归一化的第一时间序列数据的测 量值的所述第一轴和表示所述经归一化的第二时间序列数据的测量值的所述第二轴而构 成的坐标系上的位置为基准对应。 所述群组产生部可以包括:代表值设定部,将存在经归一化的顺序对的区域产生 作为群组,利用存在于产生的群组的所述经归一化的顺序对来设定所述产生的群组的代表 值,所述经归一化的顺序对以所述格子型分割坐标系中所述位置为基准对应。 所述代表值设定部可以当存在于所述群组的经归一化的顺序对为一个时,将一个 所述经归一化的顺序对设定为所述代表值,当存在于所述群组的经归一化的顺序对本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201410239436.html" title="数据分析装置和方法原文来自X技术">数据分析装置和方法</a>

【技术保护点】
一种数据分析装置,包括:接收部,接收由第一传感器测量的第一时间序列数据和由第二传感器测量的第二时间序列数据;数据合并部,利用所述第一时间序列数据和所述第二时间序列数据来产生顺序对组,所述顺序对组包括一个以上的顺序对而产生,所述顺序对由所述第一时间序列数据的与特定时刻对应的测量值和所述第二时间序列数据的与所述特定时刻对应的测量值构成;和群组产生部,利用所述顺序对组来产生群组,所述顺序对组以在包括表示所述第一时间序列数据的测量值的第一轴和表示所述第二时间序列数据的测量值的第二轴而构成的坐标系上的位置为基准对应。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:徐范准金炯赞吴圭三权纯焕吴民焕
申请(专利权)人:三星SDS株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1