一种情感分析模型训练方法、装置和存储介质制造方法及图纸

技术编号：33721781 阅读：14 留言：0更新日期：2022-06-08 21:14

本申请涉及一种情感分析模型训练方法，包括：获取原始训练样本集；将所述原始训练样本集输入BT文本增强模块，得到第一训练样本集；将所述原始训练样本集输入EDA文本增强模块，得到第二训练样本集；将所述第一训练样本集和所述第二训练样本集输入到筛选融合模块，得到第三训练样本；将所述第三训练样本集输入到卷积神经网络模块，对所述卷积神经网络模块进行训练，得到所述情感分析模型。本申请实施例可以利用较小数据对模型进行训练，能达到大数据集对模型的训练效果。集对模型的训练效果。集对模型的训练效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种情感分析模型训练方法、装置和存储介质

[0001]本专利技术涉及计算机
，尤其涉及一种情感分析模型训练方法。

技术介绍

[0002]随着生活水平提高，手机、平板等移动电子设备大规模普及，使互联网的受众群体由少数变为大多数。人类与互联网的交互方式，也由传统的鼠标、键盘，逐步转变为触摸屏、语音、手势等，使人们通过互联网沟通交流更加便捷。互联网用户逐渐由之前信息被动接受者角色，转变为信息创造者的角色。
[0003]种类繁多的网络平台在这种情况下应运而生，如微博、贴吧、淘宝、京东、腾讯新闻，还有一些社交软件，如抖音、快手等。人们在通过这些网络媒介接受外界信息，同时也通过这些网络媒介提供的各种评论功能，书写、发表自己对某些事物的看法，这些网络平台成为人们交流和表达观点的场所。因此这些网络平台保留了海量带有情感的文本信息,通过对这些带感情倾向的文本进行情感分析，能够得出有价值的信息[2]。如果仅仅依靠人力去搜集、统计和分析这些海量数据，对于那些具有很强时效性的信息，要在较短时间得出结论，这显然不太现实。因此迫切的需要计算机能够帮助人们搜集、统计和分析处理这些数据，并最终能够给出建议。
[0004]自从在技术上解决了深度学习网络模型的训练问题，卷积神经网络在自然语言处理领域得到了广泛的应用。特别是卷积神经网络在图像方面取得出色表现，研究者们开始考虑将卷积神经网络迁移到情感分析研究这个方向，经过不断的研究表明卷积神经网络能很好的处理文本情感分析问题，卷积神经网络在文本情感分析...

【技术保护点】

【技术特征摘要】
1.一种情感分析模型训练方法，其特征在于，获取原始训练样本集；将所述原始训练样本集输入BT文本增强模块，得到第一训练样本集；将所述原始训练样本集输入EDA文本增强模块，得到第二训练样本集；将所述第一训练样本集和所述第二训练样本集输入到筛选融合模块，得到第三训练样本；将所述第三训练样本集输入到卷积神经网络模块，对所述卷积神经网络模块进行训练，得到所述情感分析模型。2.如权利要求1所述的情感分析模型训练方法，其特征在于，所述将所述第一训练样本集和所述第二训练样本集输入到筛选融合模块，得到第三训练样本，包括：将所述第一训练样本集向量化，得到第一向量化训练样本集；将所述第二训练样本集向量化，得到第二向量化训练样本集；删除所述第一向量化训练样本集中的第一冗余向量；其中，所述第一冗余向量为所述第二向量化训练样本集中存在与所述第一冗余向量相似度大于阈值的向量；将所述第二向量化训练样本集和删除所述第一冗余向量后的第一量化训练样本集合并得到所述第三训练样本。3.如权利要求2所述的情感分析模型训练方法，其特征在于，所述将所述第一训练样本集和所述第二训练样本集输入到筛选融合模块，得到第三训练样本，包括：将所述第一训练样本集向量化，得到第一向量化训练样本集；将所述第二训练样本集向量化，得到第二向量化训练样本集；或者删除所述第二向量化训练样本集中的第二冗余向量；其中，所述第二冗余向量为所述第一向量化训练样本集中存在与所述第二冗余向量相似度大于阈值的向量；将所述第一向量化训练样本集和删除所述第二冗余向量后的第二量化训练样本集合并得到所述第三训练样本...

【专利技术属性】
技术研发人员：李明超，张寿明，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人