用于大规模机器学习的方法和装置制造方法及图纸

技术编号:18580641 阅读:53 留言:0更新日期:2018-08-01 14:49
分析大量数据中的模式并且基于分析采取动作涉及接收数据并且训练数据以创建训练示例,并且然后使用训练示例来选择预测数据流中模式的不同类别的特征。该过程进一步涉及基于所选择的特征,使用该数据并行地训练ANN集合,并且仅提取表示数据中来自ANN集合的模式的类别的有效节点。该过程继续进行如下步骤:向每个提取的有效节点添加类别标签,基于加类别标签的有效节点对数据中的模式进行分类,并且基于数据中的分离模式采取动作。

Methods and devices for large-scale machine learning

The patterns in large amounts of data are analyzed and the analysis takes action to receive data and train data to create training examples, and then use the training examples to select the different categories of patterns in the prediction data stream. The process is further related to the selected features, using the data to train the ANN set in parallel, and to extract only effective nodes in the category of the pattern from the ANN set in the data. The process continues to follow the following steps: add class labels to each of the extracted effective nodes, classify the patterns in the data based on the valid nodes added to the class label, and take action based on the separation mode in the data.

【技术实现步骤摘要】
【国外来华专利技术】用于大规模机器学习的方法和装置相关申请的交叉引用本申请要求2015年6月30日提交的代理人案卷号为143677.001111的美国临时申请号62/186,891的权益,该申请全部内容通过引用并入本文。
技术介绍
随着高维度存储的大数据和流送数据的出现,需要的是非常大规模的机器学习。对于这样的机器学习将有优势的是非常快速,容易扩大容量和维度,能够从流送数据进行学习,针对高维度数据自动执行维度降低,并且可以在大规模并行硬件上部署。人工神经网络(ANN)很好地解决了大规模机器学习的这些挑战。
技术实现思路
本专利技术的实施例提供一种用于分析数据流中的模式并基于该分析采取动作的方法。接收大量数据,并且对数据进行训练以创建训练示例。使用训练示例来选择特征,该特征预测数据中模式的不同类别。基于所选特征,使用该数据来训练Kohonen网络集合。然后,从表示数据中模式的类别的所述Kohenen网集合识别并提取有效节点。将类别分配给所提取的有效节点。然后,可以基于所分配的类别来采取动作。附图说明图1图示了根据本专利技术的实施例的超球体分类网络。图2图示了在本专利技术的实施例中使用的Kohonen网络的一般架构。本文档来自技高网...

【技术保护点】
1.一种用于分析大量数据中的模式并且基于所述分析采取动作的方法,包括:接收所述大量数据;训练所述数据以创建多个训练示例;使用所述训练示例来选择多个特征,所述多个特征预测所述数据中模式的不同类别;基于所选择的多个特征,使用所述数据并行训练多个ANN,所述多个ANN中的每个ANN是自组织映射;仅提取表示数据中来自所述多个ANN的模式的类别的有效节点,并且向每个提取的有效节点添加类别标签;基于加类别标签的有效节点对数据中的模式进行分类;以及基于所述数据中的分类模式采取动作。

【技术特征摘要】
【国外来华专利技术】2015.06.30 US 62/1868911.一种用于分析大量数据中的模式并且基于所述分析采取动作的方法,包括:接收所述大量数据;训练所述数据以创建多个训练示例;使用所述训练示例来选择多个特征,所述多个特征预测所述数据中模式的不同类别;基于所选择的多个特征,使用所述数据并行训练多个ANN,所述多个ANN中的每个ANN是自组织映射;仅提取表示数据中来自所述多个ANN的模式的类别的有效节点,并且向每个提取的有效节点添加类别标签;基于加类别标签的有效节点对数据中的模式进行分类;以及基于所述数据中的分类模式采取动作。2.根据权利要求1所述的方法,其中,接收所述大量数据包括接收流送数据(“数据流”)。3.根据权利要求2所述的方法,其中,训练所述数据包括使用所述数据流并行地训练第一多个Kohonen网络,以创建所述多个训练示例;并且其中,并行训练所述多个ANN包括并行训练与所述第一多个Kohenen网络不同的第二多个Kohonen网络,每个ANN均是自组织映射。4.根据权利要求3所述的方法,进一步包括:在并行训练所述第二多个Kohonen网络之前,丢弃所述第一多个Kohonen网络。5.根据权利要求3所述的方法,其中,所述多个训练示例是针对所述数据流中模式的每个类别创建的,并且由所述第一多个Kohonen网络中的节点表示。6.根据权利要求1所述的方法,其中,使用所述训练示例来选择预测所述数据中模式的不同类别的所述多个特征降低所述数据的维度。7.根据权利要求1所述的方法,其中,使用所述训练示例来选择预测所述数据中模式的不同类别的所述多个特征是要产生在不同类别中的模式之间的分离并且还使得每个类别内的模式更紧凑。8.一种用于对具有多个特征的数据进行分类的方法,所述多个特征属于流送数据中的模式的多个类别,所述方法包括:接收所述流送数据;通过处理所述流送数据来并行训练具有不同网格大小并且针对所述多个特征的多个不同子集的第一多个Kohonen网络,其中,所述第一多个Kohonen网络形成聚类,其中,有效节点是聚类的中心并且用作所述流送数据中的类别的代表性示例;将所述第一多个Kohonen网络中的所述有效节点分配到所述多个类别中的一个;针对所述多个类别中的每个类别排列所述多个特征;基于所述排列将所述多个特征中的一个或多个特征分组到多个分离种类中的每个中;通过处理所述数据,针对每个种类中的所述多个特征中的每个来并行训练具有不同网格大小的第二多个Kohonen网络;将所述第二多个Kohonen网络中的有效节点分配到所述多个类别中的一个类别;以及从所述第二多个Kohonen网络中的有效节点的子集创建一组超球体分类器。9.根据权利要求8所述的方法,其中,将所述第一多个Kohonen网络中的所述有效节点分配到所述多个类别中的一个类别基于每个有效节点被属于所述多个类别中的每个的特征激活的次数。10.根据权利要求8所述的方法,其中,将所述第二多个Kohonen网络中的有效节点分配到所述多个类别中的一...

【专利技术属性】
技术研发人员:阿西姆·罗伊
申请(专利权)人:亚利桑那州立大学董事会
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1