【技术实现步骤摘要】
一种基于情感词典的情感增强装置
[0001]本专利技术涉及人工智能领域,具体为一种基于情感词典的情感增强装置。
技术介绍
[0002]现有的词嵌入技术包括但不限于Word2Vec,GloVe,ELMo,BERT,GPT等。这些模型都能够实现根据句子中的语义与句法知识为词语赋值一个词向量。但是却不能够融入情感信息到词向量中。
[0003]SAWE模型通过一个MLP将词向量映射到其情感强度的空间中,TransE通过向量的加法获得了头结点与尾结点之间的映射关系,ERNIE通过将知识图谱引入到BERT中,得到了知识增强的命名实体识别模型,Sent2Vec通过将句子进行句嵌入,并通过MLP的结构能够得到句子到情感的映射关系。
[0004]专利号:CN201510917819.9;专利技术专利名称:构建情感词典的方法及装置;一种构建情感词典的方法,其特征在于,所述方法包括:获取多个待识别的建模语料;从每个待识别的建模语料中,获取至少一个情感特征词;对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,所述至少两个标注结果由发表者及多个接收者标注,每个标注结果对应一个分类情感标签;根据对所述情感特征词的至少两个标注结果,判断所述情感特征词是否满足预设条件;如果所述情感特征词满足所述预设条件,将所述情感特征词加入到情感词典中,所述对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,包括:将所述情感特征词及分类情感标签列表发送至所述发表者所在的移动终端,所述分类情感标签列表中包括多个分类情感标签;接收所述 ...
【技术保护点】
【技术特征摘要】
1.一种基于情感词典的情感增强装置,其特征在于:包括所述功能模块如下:第一功能模块是数据抓取和存储,在所述本服务器上采取数据抓取方式,获得所述外部服务器上大于等于2个所述情感词典的情感词语与其情感标签,获得所述情感词语与其情感标签的品质鲁棒性;将抓取的所述情感词语与其情感标签的地址信息,存放在所述第一存储器备用;训练抓取的所述情感词语与其情感标签,产生的数据存放在所述第二存储器;所述第一存储器与所述第二存储器分开,具有稳定鲁棒性;第二功能模块是构造知识图谱三元组,对所述情感词语与其所述情感标签分类,采用开放的方式兼容不同所述情感词典的分类;采用所述抓取的情感词语与所述抓取的情感词语的情感标签构造成所述的知识图谱三元组{w,r,p},w为所述抓取的情感词语,p为所述抓取的情感词语的情感标签,r是所述w与p之间的映射关系,通过随机正态分布为每个抓取的所述情感词语生成一个情感映射向量r,所述情感映射向量r通过训练取得更多的信息;第三功能模块是获得情感增强向量矩阵,以所述神经网络的嵌入方式将抓取的所述情感词语从离散的变量映射为连续数字向量,通过所述嵌入层将其编码为词向量矩阵X,其中X={w1,w2,...,w
n
},n为所述抓取的情感词语的总数,接着,为每个所述抓取的情感词语赋予一个所述情感映射向量r,生成所述情感映射向量矩阵R,将所述词向量矩阵X与情感映射向量矩阵R相加,得到所述情感增强向量矩阵S;第四功能模块是获得预测的情感标签,由于所述情感增强向量矩阵S的维度远高于抓取的所述情感词语的情感标签p的维度,通过所述神经网络的全连接层对所述情感增强向量矩阵S降维,得到所述模型预测的情感标签o;第五功能模块是训练情感增强向量,所述神经网络的输出层的所述预测的情感标签o与抓取的所述情感词语的情感标签p进行计算,求得所述损失L,所述损失L通过反向传播,,从而更新其参数;再利用所述Adam优化器更新所述损失L的参数,获得新的所述模型参数就是训练好的情感增强向量,所述模型参数矩阵就是训练好的情感增强矩阵R
’
,即训练好的所述情感映射向量矩阵R;第六功能模块是获得情感增强后的词向量,提取出所述训练好的情感增强矩阵R
’
,并与所述词向量矩阵X相加,得到所述情感增强后的词向量E。2.根据权利要求1所述一种基于情感词典的情感增强装置,其特征在于:所述第一存储器与所述第二存储器分开,采用多个服务器模式,当第二存储器出现故障、网络过载或有意攻击情况下,所述多个服务器,调用第一存储器备用所述情感词语与其情感标签的地址信息,省去所述数据抓取环节,在经过所述第二功能模块、第三功能模块、第四功能模块、第五功能模块、第六功能模块,快速重生所述第二存储器上失...
【专利技术属性】
技术研发人员:李显勇,李齐治,杜亚军,范永全,陈晓亮,
申请(专利权)人:西华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。