【技术实现步骤摘要】
情感增强装置基于情感词典的适用方法
[0001]本专利技术涉及人工智能领域,具体为情感增强装置基于情感词典的适用方法。
技术介绍
[0002]现有的词嵌入技术包括但不限于Word2Vec,GloVe,ELMo,BERT,GPT等。这些模型都能够实现根据句子中的语义与句法知识为词语赋值一个词向量。但是却不能够融入情感信息到词向量中。
[0003]SAWE模型通过一个MLP将词向量映射到其情感强度的空间中,TransE通过向量的加法获得了头结点与尾结点之间的映射关系,ERNIE通过将知识图谱引入到BERT中,得到了知识增强的命名实体识别模型,Sent2Vec通过将句子进行句嵌入,并通过MLP的结构能够得到句子到情感的映射关系。
[0004]由于现有的预训练技术无法很好地将情感信息嵌入到词向量中,导致在进行情感分析的任务时,模型容易判断错误两个语义与句法相似的词语的情感极性;本专利技术通过训练一个情感增强向量,来构建一种词向量到其情感标签之间的映射关系,通过反向传播来训练该情感增强向量,当训练完成后,通过相加原始词 ...
【技术保护点】
【技术特征摘要】
1.情感增强装置基于情感词典的适用方法,其特征在于所述情感增强装置包括以下六个功能模块:第一功能模块是数据抓取和存储,通过在本服务器上采取数据抓取方式,获得外部服务器上大于等于2个情感词典的情感词语与其情感标签,获得情感词语与其情感标签的品质鲁棒性;将抓取的情感词语与其情感标签的地址信息,存放在第一存储器备用;训练抓取的情感词语与其情感标签,产生的数据存放在第二存储器;第一存储器与第二存储器分开,具有稳定鲁棒性;第二功能模块是构造知识图谱三元组,对情感词语与其情感标签分类,采用开放的方式兼容不同情感词典的分类;采用抓取的情感词语与抓取的情感词语的情感标签构造成的知识图谱三元组{w,r,p},w为抓取的情感词语,p为抓取的情感词语的情感标签,r是w与p之间的映射关系,通过随机正态分布为每个抓取的情感词语生成一个情感映射向量r,情感映射向量r通过训练取得更多的信息;第三功能模块是获得情感增强向量矩阵,以神经网络的嵌入方式将抓取的情感词语从离散的变量映射为连续数字向量,通过嵌入层将其编码为词向量矩阵X,其中X={w1,w2,...,w
n
},n为抓取的情感词语的总数,接着,为每个抓取的情感词语赋予一个情感映射向量r,生成情感映射向量矩阵R,将词向量矩阵X与情感映射向量矩阵R相加,得到情感增强向量矩阵S;神经网络的全连接层对情感增强向量矩阵S降维,模型预测的情感标签o,设全连接层权重矩阵为K,隐藏层偏置为b,预测的情感标签o的计算方式为o=softmax(KS+b)定义抓取的情感词语向量矩阵为x={w1,w2,
…
,w
n
},通过嵌入层将其编码为词向量矩阵X={w1,w2,
…
,w
n
}:X=embed(x)用连续数字向量表示具有离散的变量的情感词语;定义情感映射向量矩阵R={r1,r2,
…
,r
n
},其中r为情感映射向量,将词向量矩阵X与情感映射向量矩阵R相加,得到情感增强向量矩阵S={s1,s2,
…
,s
n
}S=X+R,第四功能模块是获得预测的情感标签,由于情感增强向量矩阵S的维度远高于抓取的情感词语的情感标签p的维度,通过神...
【专利技术属性】
技术研发人员:李显勇,李齐治,杜亚军,范永全,陈晓亮,
申请(专利权)人:西华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。