基于强化学习和胶囊网络的文本分类模型及方法技术

技术编号：20160523 阅读：19 留言：0更新日期：2019-01-19 00:13

本发明专利技术涉及自然语言处理、文本分类的技术领域，更具体地，涉及基于强化学习和胶囊网络的文本分类模型及方法。本发明专利技术以强化学习Actor‑Critic，胶囊网络CapsNet为基本的框架，胶囊网络提取文本信息的特征，强化学习判别胶囊层之间的联系。本发明专利技术的创新内容在于引入了强化学习去学习胶囊网络层之间的路由关系，引入胶囊网络去解决文本分类模型中的多标签分类的任务。利用胶囊网络在多标签分类任务上的优势，应用于文本多标签分类的任务上，从而达到更好的效果；利用强化学习遇错调整的机制，学习到更好的路由之间的联系方法。

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习和胶囊网络的文本分类模型及方法
本专利技术涉及自然语言处理、文本分类的
，更具体地，涉及基于强化学习和胶囊网络的文本分类模型及方法。
技术介绍
特征学习是人工智能领域的一个基本的问题，特别是在自然语言处理方面，特征的提取更是重要。而在自然语言处理中，文本分类是一个十分基础，十分常见的过程，它十分依赖于特征的学习过程。与图像领域不同，文本的语义逻辑更难被捕捉到并且表达出来，从而导致在文本上的分类任务难度更大。自然语言处理中的通用人工智能的实现基础就是机器要理解人类的语言，即理解文本的语义信息，从而能够执行所规定的任务。而文本分类是机器理解文本语义信息任务里的基础任务，因而本文具有重要的研究意义。对于现在的文本分类模型，在多标签文本分类任务上的表现并没有类似于单标签文本分类模型的不错的效果，而基于胶囊网络的文本分类模型在这一领域具有得天独厚的优势，而其路由算法在某种程度上属于一种无监督的聚类算法，而强化学习在聚类方面具有不错的效果。现在主流的文本特征表示方法大体可以分为四类。1.词袋特征模型是一类不考虑句子中词语的顺序的文本特征表示方法，它将句中的词语进行编码，句子中词语的特征向量长度就是词袋的大小，比如，Mohit等人提出的DAN模型，它将一个句子中的词语进行拆分标记，再传入神经网络结构里，这些标记的词语不保留原来的位置信息；Joulin等人提出的fasttext模型，它将词语直接通过一个lookuptable，并加入一个神经网络模型，没有考虑到词语的顺序信息。2.序列表示模型则是一类考虑词语顺序的模型，比如ConvolutionalNeu...

【技术保护点】
1.基于强化学习和胶囊网络的文本分类模型，其特征在于，包括强化学习的框架与胶囊网络的框架；强化学习的框架包括：State：表示当前的状态，这里的状态主要包含了Agent所处的环境，自身状态；Action：表示Agent的行动，这里的行动最主要是胶囊层之间的连接与否，或者是连接概率；Reward：表示Agent获得的奖励，分为即时奖励和未来的奖励。

【技术特征摘要】
1.基于强化学习和胶囊网络的文本分类模型，其特征在于，包括强化学习的框架与胶囊网络的框架；强化学习的框架包括：State：表示当前的状态，这里的状态主要包含了Agent所处的环境，自身状态；Action：表示Agent的行动，这里的行动最主要是胶囊层之间的连接与否，或者是连接概率；Reward：表示Agent获得的奖励，分为即时奖励和未来的奖励。2.权利要求1所述的基于强化学习和胶囊网络的文本分类模型的方法，其特征在于：胶囊网络的框架包括以下步骤：S1.将原始的rawtext经过分词或者是分字，再经过一个lookuptable转换成embedding形式的字或者词；S2.将embedding形式的字或者词根据TextCNN的方法得到卷积后的PrimaryCapsule；S3.将PrimaryCapsule经过Routing后与下一层CapsuleLayer连接，随后与FullConnectNetwork连接，输出不同的标签的概率大小；S4.经过BP算法修改FullConnectLayer的权重大小，以及Embedding层中lookuptable的各个词的representation。3.根据权利要求2所述的基于强化学习和胶囊网络的文本分类模型的方法，其特征在于：所述的步骤S1中，具体过程是：S11.先根据已有的wordembedding来初始化自己的lookuptable，其中embedding的深度为300，至于没有出现过的则置为0或者0-1之间的随机数；S12.然后再通过搜寻的方式，对于r...

【专利技术属性】
技术研发人员：林东定，潘嵘，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人