用于周期现象的聚类技术制造技术

技术编号：2845921 阅读：170 留言：0更新日期：2012-04-11 18:40

一种数据处理系统处理集体描述在一个物理过程中的几个实体中的至少一个变量的周期行为的数据组。每个周期包括几个时隙。输入例程（２－４）接收多个数据组，每个数据组包含多个数据项，每个数据项描述在一个时隙中的实体的变量。幅度确定例程（２－６）为几个实体的每一个确定诸如平均值、量值或峰值这样的具体幅度参数。定标例程（２－８）定标实体间的数据组，使具体幅度参数受到抑制并只保持其形状。训练例程（２－１０）用第一多个定标的数据组训练聚类系统，以确定一组聚类中心。训练后，聚类例程（２－１２）将第二多个定标的数据组施加到受训练的聚类系统。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于周期现象的聚类技术。例如，本专利技术可用于处理集体描述在一个物理过程中的几个实体的一个或多个变量的周期行为的数据组。
技术介绍
聚类技术，诸如K-均值算法、分层聚类技术、自组织映射等，已广泛用于分析物理过程的变量行为。为了提供一个具体的但非限制性的示例，该物理过程可以是一个蜂窝电信网络的运作过程，其中几个实体中的每一个可以是该网络的小区或一些其它资源，而一个或多个的变量可以是性能指示符，例如业务量、资源使用，丢失的连接数目(或百分数)等。现有的聚类技术存在着忽略了大量有用信息的缺点。
技术实现思路
本专利技术的目的是为了提供一种方法和实施该方法的装置，用以克服上述缺点。本专利技术的目的是通过具有独立权利要求中描述的技术特征的方法和设备来实现的。本专利技术的优选实施例公开在从属权利要求中。本专利技术是基于这样一个发现现有聚类技术将变量视为绝对量。在电信网络的环境下，这是可理解的，因为例如网络是受诸如业务信道数目这样的物理资源制约的，不能超过该数目。于是自然要考虑物理资源是否被超过的反常的情况。但正是这种将变量视作绝对值的观测使得大量有用的信息被浪费掉了。因此，本专利技术部分地基于如下的构思小实体的周期行为可以类似于如果绝对值受抑制的大实体的周期行为。上述构思可以由用于处理集体描述在一个物理过程中的几个实体中的至少一个变量的周期行为的数据组的方法来实现。该方法包括下列步骤1.确定在周期行为中的第一周期，并将该第一周期分成多个时隙；2.确定多个数据组，每个数据组包含多个数据项，使得每个数据项描述在一个时隙中的实体的变量；3.为几个实体的每一...

【技术保护点】
一种用于处理数据组的方法，该数据组集体描述在一个物理过程中的几个实体（１０２）中的至少一个变量的周期行为；该方法包括：确定（２－２）在该周期行为中的第一周期并且将该第一周期分成多个时隙；确定（２－４）多个数据组，每个数据组包含多个数据项，使得每个数据项描述在一个时隙中的实体的变量；为该几个实体中的每一个确定（２－６）具体幅度参数（８２）；定标（２－８）实体间的该数据组，使得该具体幅度参数得以抑制；用第一多个所定标的数据组训练（２－１０）聚类系统以确定一组聚类中心（３１－３４；７２、８３）；以及使用（２－１２）所训练的聚类系统聚类第二多个所定标的数据组。

【技术特征摘要】
【国外来华专利技术】US 2003-12-31 10/748,6731.一种用于处理数据组的方法，该数据组集体描述在一个物理过程中的几个实体(102)中的至少一个变量的周期行为；该方法包括确定(2-2)在该周期行为中的第一周期并且将该第一周期分成多个时隙；确定(2-4)多个数据组，每个数据组包含多个数据项，使得每个数据项描述在一个时隙中的实体的变量；为该几个实体中的每一个确定(2-6)具体幅度参数(82)；定标(2-8)实体间的该数据组，使得该具体幅度参数得以抑制；用第一多个所定标的数据组训练(2-10)聚类系统以确定一组聚类中心(31-34；72、83)；以及使用(2-12)所训练的聚类系统聚类第二多个所定标的数据组。2.根据权利要求1的方法，其中为每个第一周期单独确定该具体幅度参数。3.根据权利要求1的方法，还包括确定作为若干该第一周期的第二周期以及就该第二周期再聚类该所聚类的数据组。4.根据权利要求1的方法，还包括处理单独地来自该聚类系统的该受抑制的具体幅度参数。5.根据权利要求1的方法，其中该聚类系统是无监聚类系统。6.根据权利要求5的方法，还包括在所述训练前用先验种子值初始化该无监聚类系统。7.根据权利要求1的方法，还包括将预定的置信区间(73、93)与该聚类中心相关联；对该第二多个所聚类的数据组的每一个确定(6-8)最佳匹配聚类中心并且检查(6-10)该所聚类的数据组是否在该最佳匹配聚类中心的所述预定的置信区间内；如果是，则归档(6-12)该最佳匹配聚类中心(83)的指示符并且丢弃所讨论的该数据组；或如果否，则对于其中该所聚类的数据组不在所述预定的置信区间内的那些时隙，归档(6-14)该数据组的数据项(85)。8.根据权利要求7的方法，其中该置信区间(93)随所描述的该变量的幅度参数的增加而逐渐变窄。9.根据权利要求1的方法，还包括使用该所聚类的第二多个所定标的数据组来检测异常情况。10.根据权利要求1的方法，还包括使用该所...

【专利技术属性】
技术研发人员：基莫阿托南，珀克卡屈姆皮莱南，珀克科韦维莱南，
申请(专利权)人：诺基亚西门子网络公司，
类型：发明
国别省市：FI[芬兰]

全部详细技术资料下载我是这个专利的主人