文本情感分析模型训练方法、装置、设备及可读存储介质制造方法及图纸

技术编号:23363527 阅读:58 留言:0更新日期:2020-02-18 17:29
本申请涉及人工智能技术领域,公开了一种文本情感分析模型训练方法、装置、设备及可读存储介质。方法包括:获取待训练的文本样本;通过预设的分词方法对文本样本进行分词处理,划分为若干个不同的词;基于预设的编码方法对若干个不同的词分别进行编码处理,得到词向量;将词向量输入至预设的深度神经网络中,基于嵌入层对词向量进行降维处理;基于深度神经网络中的隐藏层对降维后的词向量进行计算,得到对应的特征;通过多分类SVM支持向量机对文本样本对应的特征进行分类,确定情感类别;基于损失函数确定情感类别与正确情感类别的差异值,当差异值满足预设条件时,判定文本情感分析模型训练完成。通过本申请,提高了文本情感分析的准确率。

Training method, device, equipment and readable storage medium of text emotion analysis model

【技术实现步骤摘要】
文本情感分析模型训练方法、装置、设备及可读存储介质
本申请涉及人工智能
,尤其涉及文本情感分析模型训练方法、装置、设备及可读存储介质。
技术介绍
在现有技术中,通常是使用深度神经网络来处理文本情感分析问题,深度神经网络能够捕捉长程的上下文信息,具有较强的特征抽取能力。但是,深度神经网络只有一个输出,因此,依靠深度神经网络只能完成二分类情感分析。因此,现有的文本情感分析方法的准确率较低。
技术实现思路
本申请的主要目的在于提供一种文本情感分析模型训练方法、装置、设备及可读存储介质,旨在解决现有的文本情感分析方法的准确率低的技术问题。为实现上述目的,本申请提供一种文本情感分析模型训练方法,所述文本情感分析模型训练方法包括以下步骤:获取待训练的文本样本,其中,所述文本样本带有标注信息,所述标注信息为所述文本样本包含的正确情感类别;通过预设的分词方法对所述文本样本进行分词处理,将所述文本样本划分为若干个不同的词;基于预设的编码方法对所述若干个不同的词分别进行编码处理,得到所述文本样本对应的词向量本文档来自技高网...

【技术保护点】
1.一种文本情感分析模型训练方法,其特征在于,所述文本情感分析模型训练方法包括以下步骤:/n获取待训练的文本样本,其中,所述文本样本带有标注信息,所述标注信息为所述文本样本包含的正确情感类别;/n通过预设的分词方法对所述文本样本进行分词处理,将所述文本样本划分为若干个不同的词;/n基于预设的编码方法对所述若干个不同的词分别进行编码处理,得到所述文本样本对应的词向量;/n将所述词向量输入至预设的深度神经网络中,基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理,得到降维后的词向量;/n基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算,得到所述文本样本对应的特征;/n通过...

【技术特征摘要】
1.一种文本情感分析模型训练方法,其特征在于,所述文本情感分析模型训练方法包括以下步骤:
获取待训练的文本样本,其中,所述文本样本带有标注信息,所述标注信息为所述文本样本包含的正确情感类别;
通过预设的分词方法对所述文本样本进行分词处理,将所述文本样本划分为若干个不同的词;
基于预设的编码方法对所述若干个不同的词分别进行编码处理,得到所述文本样本对应的词向量;
将所述词向量输入至预设的深度神经网络中,基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理,得到降维后的词向量;
基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算,得到所述文本样本对应的特征;
通过多分类SVM支持向量机对所述文本样本对应的特征进行分类,确定所述文本样本对应的情感类别;
基于损失函数确定所述情感类别与所述正确情感类别的差异值,当所述差异值满足预设条件时,判定所述文本情感分析模型训练完成。


2.如权利要求1所述的文本情感分析模型训练方法,其特征在于,所述通过预设的分词方法对所述文本样本进行分词处理,将所述文本样本划分为若干个不同的词包括:
基于标准语料库计算所述文本样本中包含的各个词对应的二元条件概率,其中,标准语料库中任意两个词W1和W2的二元条件概率分布表示为:






其中,freq(W1,W2)表示W1和W2在标准语料库中相邻一起出现的次数,freq(W1)和freq(W2)分别表示W1和W2在标准语料库中出现的统计次数;
基于所述二元条件概率确定所述文本样本中各个词的联合分布概率,从所述联合分布概率中确定最大联合分布概率,将所述最大联合分布概率对应的分词方法,确定为所述文本样本对应的最优分词方法;
基于所述最优分词方法将所述文本样本划分为若干个不同的词。


3.如权利要求1所述的文本情感分析模型训练方法,其特征在于,所述基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算,得到所述文本样本对应的特征包括:
将第L-1段文本样本对应的所述降维后的词向量作为第1段文本样本的特征,并获取所述预设的深度神经网络中第L-1层隐藏层的权重矩阵,基于非线性激活函数对所述第L-1层的权重矩阵及所述第1段文本样本的特征进行计算,得到第L段文本样本的特征,其中,基于非线性激活函数进行计算的公式如下:






其中,Xi为第i段文本样本经过分词及编码处理后得到的词向量,hi1为所述预设的深度神经网络提取出的第1段文本样本的特征,σ为非线性激活函数,WL-1为所述预设的深度神经网络中第L-1层隐藏层的权重矩阵,hiL为所述预设的深度神经网络提取出的第L段文本样本的特征。


4.如权利要求3所述的文本情感分析模型训练方法,其特征在于,所述通过多分类SVM支持向量机对所述文本样本对应的特征进行分类,确定所述文本样本对应的情感类别包括:
随机初始化k个权重向量Wy,则对于第i个文本样本,所述多分类SVM支持向量机的决策为:



其中,k为所述多分类SVM支持向量机的预设数据集中的情感类别数目;
将的最大乘积对应的情感类别确定为所述文本样本对应的情感类别。


5.一种文本情感分析模型训练装置,其特征在于,所述文本情感分析模型训练装置包括:
获取模块,用于获取待训练的文本样本,其中,所述文本样本带有标注信息,所述标注信息为所述文本样本包含的正确情感类别;
分词模块...

【专利技术属性】
技术研发人员:金戈徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1