This application discloses a classification method and device, a computer readable storage medium. The method includes: input characteristic data into a pre-established depth confidence neural network model; parallel calculation of the activation probability between hidden layer and explicit layer by multi-threaded parallel Gibbs sampling, and parallel updating according to the sampling results. The weights and bias values of each neuron are used as initial training parameters to supervise the deep confidence neural network model, and the trained deep confidence neural network model is used for classification and recognition. This application uses multi-threaded parallel Gibbs sampling and updates the weights and bias values of each neuron in parallel, which brings the advantage of parallel algorithm into full play and improves the operation speed of the system.
【技术实现步骤摘要】
一种分类方法及装置、计算机可读存储介质
本专利技术涉及计算机
,具体涉及一种分类方法及装置、计算机可读存储介质。
技术介绍
随着各行业数据的迅速增长和数据库、数据分析技术的不断发展,用于发现事先未知规则和联系的机器学习和数据挖掘技术已经用于市场分析、工业生产、金融、科学研究、Web信息分析以及工程诊断等领域,并取得较好效果。作为主要的数据分析模式,分类算法主要适用于预测分类标号或离散值,属监督性学习问题,通常先训练(用训练数据来训练模型,生成模型参数)再分类(用测试数据产生分类结果),常用的分类算法包括决策树、贝叶斯、支持向量机、神经网络等。深度学习可基于原始数据分析并发现数据的分布式特征表示,优点是用特征学习和分层特征提取高效算法替代手工获取特征,近些年引起了更广泛的关注。但是,现有的数据挖掘算法应用于海量数据的处理速度和输入/输出(Input/output,I/O)瓶颈一直存在着限制,应用并行运算可改善这些问题。图形处理器(GraphicsProcessingUnit,GPU)作为一种重要的并行加速方式,正被广泛的应用于深度学习中。CUDA(ComputeUnifiedDeviceArchitecture)和OpenMP(OpenMulti-Processing)被用于基于神经网络的文本检测系统,可在单指令流下同时处理多个数据流,提高了GPU存储空间的利用率,局限是数据并行方式没有发挥算法并行的优势。国内外互联网公司为深度学习的研究搭建了各种GPU集群,可在多台GPU服务器上进行神经网络模型的训练,但设备规模较大,成本较高。
技术实现思路
为了解决上 ...
【技术保护点】
1.一种分类方法,其特征在于,包括:将特征数据输入预先建立的深度置信神经网络模型;通过多线程并行吉布斯抽样,根据抽样结果并行计算隐层与显层之间相互被激活的概率,并行更新每个神经元之间的权重以及偏置值;将更新后的每个神经元之间的权重以及偏置值作为初始化训练参数,对深度置信神经网络模型进行有监督训练;利用训练好的深度置信神经网络模型进行分类识别。
【技术特征摘要】
1.一种分类方法,其特征在于,包括:将特征数据输入预先建立的深度置信神经网络模型;通过多线程并行吉布斯抽样,根据抽样结果并行计算隐层与显层之间相互被激活的概率,并行更新每个神经元之间的权重以及偏置值;将更新后的每个神经元之间的权重以及偏置值作为初始化训练参数,对深度置信神经网络模型进行有监督训练;利用训练好的深度置信神经网络模型进行分类识别。2.根据权利要求1所述的分类方法,其特征在于,所述通过多线程并行吉布斯抽样,根据抽样结果并行计算隐层与显层之间相互被激活的概率,并行更新每个神经元之间的权重以及偏置值,包括:并行吉布斯抽样,同时抽取显层上每个神经元的值,计算每个隐层神经元被显层神经元激活的概率值:其中i∈[0,M],j∈[0,N],v为显层数据值,h为隐层数据值,M为显层神经元个数,N为隐层神经元个数;W为权重,b为显层偏置值,c为隐层偏置值;通过隐层h(0)重构显层v(1),再次并行吉布斯抽样,计算显层神经元被隐层神经元激活的概率值:通过显层v(1)重构隐层h(1),再次并行吉布斯抽样,计算隐层神经元被显层神经元激活的概率值:并行更新每个神经元之间的权重以及偏置值:其中,η为预设的学习率。3.根据权利要求1所述的分类方法,其特征在于,所述将更新后的每个神经元之间的权重以及偏置值作为初始化训练参数,对深度置信神经网络模型进行有监督训练,包括:根据反向传播算法,对所述深度置信神经网络模型中的深度BP神经网络进行有监督调优训练;采用梯度下降算法迭代更新各层的权重及偏置值,直到各层的权重及偏置值达到最优化。4.根据权利要求1所述的分类方法,其特征在于,所述方法之前还包括:获取传感器采集的数据,对获取的数据经过信号处理得到特征数据。5.根据权利要求4所述的分类方法,其特征在于,所述对获取的数据经过信号处理得到特征数据,包括:将获取的数据按时序加窗划分为多个数据块;通过多线程对划分出的多个数据块进行并行特征提取,并将各个线程提取的特征按类别进行合并,得到合并后的特征数据。6.根据权利要求5所述的分类方法,其特征在于,当...
【专利技术属性】
技术研发人员:凌茵,沈毅,
申请(专利权)人:北京旋极信息技术股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。