情感增强装置基于情感词典的适用方法制造方法及图纸

技术编号：36804986 阅读：27 留言：0更新日期：2023-03-09 00:09

本发明专利技术涉及人工智能领域，具体为情感增强装置基于情感词典的适用方法，本装置包含有六个功能模块，能够借助外部的情感词典，组建本服务器上的情感词典数据库，且具有品质鲁棒性和稳定鲁棒性；现有的词嵌入技术，并不能很好的区分句法与语义相似的情感标签相反的词语，同时，现有的情感增强技术，对模型的性能提升也十分有限，通过将词向量映射到情感标签的向量空间，从而找到情感增强向量，首先定义了情感增强向量，将其与词向量相加，通过全连接层降维，能够得到词向量到情感标签之间的映射关系，接着通过反向传播算法更新参数，能够训练出情感增强向量，最后，将情感增强向量与需要增强的词向量相加，即可得到需要的情感增强后的词向量。的词向量。

全部详细技术资料下载

【技术实现步骤摘要】
情感增强装置基于情感词典的适用方法

[0001]本专利技术涉及人工智能领域，具体为情感增强装置基于情感词典的适用方法。

技术介绍

[0002]现有的词嵌入技术包括但不限于Word2Vec，GloVe，ELMo，BERT，GPT等。这些模型都能够实现根据句子中的语义与句法知识为词语赋值一个词向量。但是却不能够融入情感信息到词向量中。
[0003]SAWE模型通过一个MLP将词向量映射到其情感强度的空间中，TransE通过向量的加法获得了头结点与尾结点之间的映射关系，ERNIE通过将知识图谱引入到BERT中，得到了知识增强的命名实体识别模型，Sent2Vec通过将句子进行句嵌入，并通过MLP的结构能够得到句子到情感的映射关系。
[0004]由于现有的预训练技术无法很好地将情感信息嵌入到词向量中，导致在进行情感分析的任务时，模型容易判断错误两个语义与句法相似的词语的情感极性；本专利技术通过训练一个情感增强向量，来构建一种词向量到其情感标签之间的映射关系，通过反向传播来训练该情感增强向量，当训练完成后，通过相加原始词...

【技术保护点】

【技术特征摘要】
1.情感增强装置基于情感词典的适用方法，其特征在于所述情感增强装置包括以下六个功能模块：第一功能模块是数据抓取和存储，通过在本服务器上采取数据抓取方式，获得外部服务器上大于等于2个情感词典的情感词语与其情感标签，获得情感词语与其情感标签的品质鲁棒性；将抓取的情感词语与其情感标签的地址信息，存放在第一存储器备用；训练抓取的情感词语与其情感标签，产生的数据存放在第二存储器；第一存储器与第二存储器分开，具有稳定鲁棒性；第二功能模块是构造知识图谱三元组，对情感词语与其情感标签分类，采用开放的方式兼容不同情感词典的分类；采用抓取的情感词语与抓取的情感词语的情感标签构造成的知识图谱三元组{w,r,p}，w为抓取的情感词语，p为抓取的情感词语的情感标签，r是w与p之间的映射关系，通过随机正态分布为每个抓取的情感词语生成一个情感映射向量r，情感映射向量r通过训练取得更多的信息；第三功能模块是获得情感增强向量矩阵，以神经网络的嵌入方式将抓取的情感词语从离散的变量映射为连续数字向量，通过嵌入层将其编码为词向量矩阵X，其中X＝{w1,w2,...,w
n
}，n为抓取的情感词语的总数，接着，为每个抓取的情感词语赋予一个情感映射向量r，生成情感映射向量矩阵R，将词向量矩阵X与情感映射向量矩阵R相加，得到情感增强向量矩阵S；神经网络的全连接层对情感增强向量矩阵S降维，模型预测的情感标签o，设全连接层权重矩阵为K，隐藏层偏置为b，预测的情感标签o的计算方式为o＝softmax(KS+b)定义抓取的情感词语向量矩阵为x＝{w1,w2,
…
,w
n
}，通过嵌入层将其编码为词向量矩阵X＝{w1,w2,
…
,w
n
}：X＝embed(x)用连续数字向量表示具有离散的变量的情感词语；定义情感映射向量矩阵R＝{r1,r2,
…
,r
n
}，其中r为情感映射向量,将词向量矩阵X与情感映射向量矩阵R相加，得到情感增强向量矩阵S＝{s1,s2,
…
,s
n
}S＝X+R，第四功能模块是获得预测的情感标签，由于情感增强向量矩阵S的维度远高于抓取的情感词语的情感标签p的维度，通过神...

【专利技术属性】
技术研发人员：李显勇，李齐治，杜亚军，范永全，陈晓亮，
申请(专利权)人：西华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人