一种基于多层LSTM模型的并行处理分类方法技术

技术编号：20364461 阅读：23 留言：0更新日期：2019-02-16 17:14

本发明专利技术提供一种基于多层LSTM模型的并行处理分类方法，涉及信息技术领域。该方法首先对数据进行预处理，根据数据的分类体系，提取多个待分类实体的基础信息；然后构建多层LSTM模型，将带有标注的训练数据输入到多层LSTM模型中，用最小平方误差为代价函数，计算多层LSTM模型输出的结果与标注结果之间的误差，并采用误差反向传播方法调整多层LSTM模型的参数，进而得到稳定收敛的多层LSTM模型；最后对于未分类的数据，进行预处理后输入到多层LSTM模型中，得到分类结果。本发明专利技术提供的基于多层LSTM模型的并行处理分类方法，能够将多组数据一起通过网络，从而在最后可以输出多个待分类实体的分类结果，这种高信息通量的网络结构大大提高了网络训练的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多层LSTM模型的并行处理分类方法
本专利技术涉及信息
，尤其涉及一种基于多层LSTM模型的并行处理分类方法。
技术介绍
我们处于一个信息化的时代，随着互联网的迅猛发展，每个人作为一个信息发布源，产生了大量的数据并在互联网中进行广泛的传播。特别是社交网站，以其庞大的用户量，是数据产生的一个重要来源。在Web2.0时代，一方面数据呈现爆发性增长，成为名副其实的海量数据，另一方面数据种类多种多样，从日志、文本再到图片视频，传统数据平台处理这样的容量非结构化的数据就显得力不从心了。为了从这些数据中找到所需要的信息，充分挖掘数据的价值，需要寻求更加高效的检索技术，而分类技术则是其中的一个关键技术。随着人工智能的不断发展，深度学习逐渐成为人工智能研究的热点和重点，在很多领域中取得了瞩目的成果与应用。深度学习通过模拟人脑思维对数据进行分析，可以得到最接近数据本质的表达和模式，具有强大的自我学习挖掘特征的能力。深度学习通过多个隐藏层实现对输入信息的多次抽象，使其拥有了解决复杂问题的能力，在众多方法中脱颖而出。深度学习可以自动地从大量的样本中学习到数据的内容信息，打破了特征工程局限于算法工程师的先验知识，通过与具体任务紧密结合，可以解决很多传统数据挖掘的各种实践应用问题。运用神经网络处理分类任务时，一般将结果向量作为待分类实体被分到各个类别的概率分布。虽然每个实体可以视作单独的分类任务进行网络训练，但是多次输入网络进行处理会使得训练速度变慢，特别现有应用场景处理的大多是网络中的海量数据，这个问题就更为严重。同时，神经网络一次处理一个实例，只能分析一个实例内容...

【技术保护点】
1.一种基于多层LSTM模型的并行处理分类方法，其特征在于：包括以下步骤：步骤1、对数据进行预处理，根据数据的分类体系，提取多个待分类实体的基础信息，并进行向量化处理；步骤2、构建多层LSTM模型；步骤3、将带有标注的训练数据输入到多层LSTM模型中，用最小平方误差为代价函数，计算多层LSTM模型输出的结果与标注结果之间的误差，并采用误差反向传播方法调整多层LSTM模型的参数，进而得到稳定收敛的多层LSTM模型；步骤4、对于未分类的数据，经过步骤1的预处理，并将其输入到步骤3得到的多层LSTM模型中，得到分类结果。

【技术特征摘要】
1.一种基于多层LSTM模型的并行处理分类方法，其特征在于：包括以下步骤：步骤1、对数据进行预处理，根据数据的分类体系，提取多个待分类实体的基础信息，并进行向量化处理；步骤2、构建多层LSTM模型；步骤3、将带有标注的训练数据输入到多层LSTM模型中，用最小平方误差为代价函数，计算多层LSTM模型输出的结果与标注结果之间的误差，并采用误差反向传播方法调整多层LSTM模型的参数，进而得到稳定收敛的多层LSTM模型；步骤4、对于未分类的数据，经过步骤1的预处理，并将其输入到步骤3得到的多层LSTM模型中，得到分类结果。2.根据权利要求1所述的一种基于多层LSTM模型的分类方法，其特征在于，步骤1所述根据数据的分类体系，提取多个待分类实体的基础信息，需要按照其重要性进行选择，优先选择重要性大的信息。3.根据权利要求1所述的一种基于多层LSTM模型的并行处理分类方法，其特征在于：步骤1所述提取多个待分类实体的基础信息，具体为：对于文本数据，所述基础信息为分词之后的词；对于图像...

【专利技术属性】
技术研发人员：杨可静，兰云飞，陈钟，李青山，吴振豪，高健博，王晓青，
申请(专利权)人：北京国信云服科技有限公司，北京大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人