基于粒子群算法优化正则化极限学习机的文本情感分析方法技术

技术编号:34466863 阅读:33 留言:0更新日期:2022-08-10 08:40
本发明专利技术公开了基于粒子群算法优化正则化极限学习机的文本情感分析方法。包括以下步骤:(1)获取待分析数据的文本信息,对所述文本信息进行预处理得到文本词汇;(2)将文本词汇采用skip

【技术实现步骤摘要】
基于粒子群算法优化正则化极限学习机的文本情感分析方法


[0001]本专利技术涉及自然语言处理中的情感分析
,特别涉及基于粒子群算法优化正则化极限学习机的文本情感分析方法。

技术介绍

[0002]现随着网络的发展,很多人已经习惯于用带有情感色彩和情感倾向的评论来表达对某件事或某产品的看法。然而海量的评论数据使得人工判断评论情感倾向性的难度增加。因此,如何自动且快速地对用户输入的评论文本进行情感分类处理得到有价值的输出成为了一个热门话题。评论文本不仅特征维数高,表达不规范而且规模大,因此在提高文本情感分类模型分类精度的同时缩小时间计算成本也十分重要。
[0003]在已有的研究中,基于情感词典、机器学习或神经网络已被广泛认为是进行情感分类的有效方法。情感词典作为判断评论情感极性的一个重要基础,需要针对特定领域建立相关的情感词典来提高分类的准确率;机器学习算法需要选取情感词作为特征词并将文本矩阵化后进行分类,处理速度相对神经网络较快。神经网络通过模拟人的大脑的思维方式来处理信息,将其应用到情感分类中可以很好的提升分类的性能。随着将卷积神经本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于粒子群算法优化正则化极限学习机的文本情感分析方法,其特征在于,包括以下步骤:获取待分析数据的文本信息,对所述文本信息进行预处理得到文本词汇;将所述文本词汇采用skip

gram模型基于同领域数据集语料库进行词向量训练得到文本词向量;利用粒子群算法将正则化极限学习机的参数初始化为一群随机粒子,然后通过迭代确定最佳参数,得到粒子群算法优化正则化极限学习机;将所述文本词向量输入粒子群算法优化正则化极限学习机,对所述文本信息进行情感分类。2.根据权利要求1所述基于粒子群算法优化正则化极限学习机的文本情感分析方法,其特征在于,所述预处理包括去重、去噪、分词、去词。3.根据权利要求1所述基于粒子群算法优化正则化极限学习机的文本情感分析方法,其特征在于,同领域数据集语料库建立的具体步骤为:S21、对所述文本词汇按照词性进行分类,得到分词词语集;S22、对分词词语集中的每种词语采用skip

gram模型进行词向量训练;S23、选出步骤S22处理后词向量的高频词,构建成同领域数据集语料库。4.根据权利要求1所述基于粒子群算法优化正则化极限学习机的文本情感分析方法,其特征在于,对于包含N个不同样本的训练集其中x
i
=[x
i1
,x
i2
,...,x
in
]
T
∈R
n
,k
i
=[k
i1
,k
i2
,...,k
im
]∈R
m
,所述正则化极限学习机的目标函数为:式中L为正则化极限学习机隐藏层神经元数量,β为输出权重,C为正则化系数,N为训练集样本数量,H为隐藏层输出矩阵,T为转置符号。5.根据权利要求4所述基于粒子群算法优化正则化极限学习机的文本情感分析方法,其特征在于,根据K...

【专利技术属性】
技术研发人员:李琳娜魏帆孙爱晶
申请(专利权)人:西安邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1