一种基于贴图表情的情感检测方法以及系统技术方案

技术编号:17995220 阅读:89 留言:0更新日期:2018-05-19 12:21
本发明专利技术公开了一种基于贴图表情的情感检测方法以及系统,方法包括:采集带有贴图表情的文本数据;对所采集来的数据进行预处理,转换为词向量数据集;将数据预处理单元生成的数据集输入一个已经训练好的网络模型,该网络模型输出相应的情感检测结果。本发明专利技术可以实现对用户评论等的情感检测;进一步地,结合了多重神经网络跟注意力机制,从而提高了对于各种情绪相关的贴图表情的辨识度;通过迭代器的方式来训练模型从而节省了内存;通过迁移学习,并且逐步解冻可以训练的参数,尽可能降低了迁移学习之后过拟合的风险,充分保留了预训练模型的特性。

【技术实现步骤摘要】
一种基于贴图表情的情感检测方法以及系统
本专利技术涉及情感分析领域,尤其涉及一种基于贴图表情的情感检测方法以及系统。
技术介绍
随着网络的不断发展以及社交平台的快速壮大,互联网中充斥着大量的非结构化文本数据,这里面含有很多有价值的,但是无法简单处理,进行提取的信息。因此如果能够自动对微博、评论等数据进行情感提取,则可以应用到产品或者服务的正负口碑监测,从而来改善产品功能或者服务的流程。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于贴图表情的情感检测方法以及系统。本专利技术解决其技术问题所采用的技术方案是:构造一种基于贴图表情的情感检测方法,方法包括:采集带有贴图表情的文本数据;对所采集来的数据进行预处理,转换为词向量数据集;将数据预处理单元生成的数据集输入一个已经训练好的网络模型,该网络模型输出相应的情感检测结果。在本专利技术所述的基于贴图表情的情感检测方法中,所述网络模型包括:输入层,用于接收输入的数据集并输出到嵌入层;嵌入层,接受输入层输出的数据集,将数据集中不可用的数据剔除后输出到激活函数层;激活函数层,接收来自嵌入层的数据集,在所设置的断开链本文档来自技高网...
一种基于贴图表情的情感检测方法以及系统

【技术保护点】
一种基于贴图表情的情感检测方法,其特征在于,方法包括:采集带有贴图表情的文本数据;对所采集来的数据进行预处理,转换为词向量数据集;将数据预处理单元生成的数据集输入一个已经训练好的网络模型,该网络模型输出相应的情感检测结果。

【技术特征摘要】
1.一种基于贴图表情的情感检测方法,其特征在于,方法包括:采集带有贴图表情的文本数据;对所采集来的数据进行预处理,转换为词向量数据集;将数据预处理单元生成的数据集输入一个已经训练好的网络模型,该网络模型输出相应的情感检测结果。2.根据权利要求1所述的基于贴图表情的情感检测方法,其特征在于,所述网络模型包括:输入层,用于接收输入的数据集并输出到嵌入层;嵌入层,接受输入层输出的数据集,将数据集中不可用的数据剔除后输出到激活函数层;激活函数层,接收来自嵌入层的数据集,在所设置的断开链接比例不为0时构建丢弃层,对数据进行变换后输出到丢弃层;在所设置的断开链接比例为0时,对数据进行变换后输出到双LSTM层;丢弃层,接收来自激活函数层的数据集,随机将丢弃层的前一个层的输入神经元断开一定百分比,并输出数据集至双LSTM层;双LSTM层,接收来自丢弃层或者激活函数层的数据集,并传给第一个BiLSTM层,将第一个BiLSTM层的输出传给第二个BiLSTM层,将双LSTM层的前一个层所得到的输出跟两个BiLSTM层的两个输出进行合并,输出处理后的数据到关注层;关注层,接收来自双LSTM层的数据集,通过注意力机制获取权重的张量,并输出处理后的数据集和权重到分类器;分类层,接收来自关注层的数据集和权重,处理得到情感检测结果,所述情感检测结果包括各种情感类型及其概率。3.根据权利要求2所述的基于贴图表情的情感检测方法,其特征在于,所述分类层包括softmax分类器和sigmoid分类器,如果需要预测的情感类型的个数大于两种类别,则使用softmax分类器,如果需要预测的情感类型的个数为两种,则使用sigmoid分类器。4.根据权利要求1所述的基于贴图表情的情感检测方法,其特征在于,所述方法还包括,在网络模型投入使用之前,执行以下训练步骤:采集带有多种常见贴图表情的文本数据;对所采集来的数据进行预处理,转换为词向量数据集,并且对数据集进行情感类型划分;将数据集中的部分作为训练数据、剩余部分作为测试数据;利用训练数据对所述网络模型进行训练;利用训练好的网络模型对所述测试数据进行预测,记录情感检测结果;根据该情感检测结果判断所训练好的网络模型是否达到要求,如果未达到要求,则继续利用训练数据对所述网络模型进行训练直至判断所训练好的网络模型达到要求。5.根据权利要求4所述的基于贴图表情的情感检测方法,其特征在于,所述方法还包括:通过迭代器的方式来训练该网络模型。6.根据权利要求1所述...

【专利技术属性】
技术研发人员:陈雷张桐
申请(专利权)人:北京联合网视文化传播有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1