对文本进行情感分类的方法、装置及终端制造方法及图纸

技术编号：21060342 阅读：40 留言：0更新日期：2019-05-08 07:03

本发明专利技术适用于计算机技术领域，提供了一种对文本进行情感分类的方法、装置、终端及计算机可读存储介质。其中，所述方法包括：对目标文本进行分词处理，得到所述目标文本的词集合；利用预设的词映射矩阵将所述词集合映射到同一多维实数空间，得到所述目标文本对应的第一文本向量，其中，所述第一文本向量的任意两个词向量单元在所述多维实数空间中的距离表示与该两个词向量单元对应的词集合中的两个词单元的相关度；对所述第一文本向量进行情感分类，确定所述目标文本的情感类别。本发明专利技术能够提高对文本进行情感分类的精度。

The Method, Device and Terminal of Emotional Classification of Text

全部详细技术资料下载

【技术实现步骤摘要】
对文本进行情感分类的方法、装置及终端
本专利技术属于计算机
，尤其涉及一种对文本进行情感分类的方法、装置、终端及计算机可读存储介质。
技术介绍
自然语言处理(NaturalLanguageProcessing，NLP)是计算机与人工智能领域中的一个重要的研究方向。目前，经常采用神经网络来进行自然语言处理。例如，可以通过卷积神经网络(ConvolutionalNeuralNetwork，CNN)或者循环神经网络(RecurrentNeuralNetwork，RNN)对文本的情感类别进行判断，如判断某文本的情感类别是消极、积极还是中性的。在将文本输入给神经网络进行处理之前，需要将文本转换为向量形式，这就需要首先将文本划分为词语单元，然而，由于文本的语义是由词语单元和词语单元的连接关系共同决定的，文本被划分成孤立的词语单元后容易产生语义丢失，而语义丢失会影响神经网络对文本的情感识别精度。
技术实现思路
有鉴于此，本专利技术提供了一种对文本进行情感分类的方法、装置、终端及计算机可读存储介质，用以解决现有技术中文本被划分成孤立的词语单元后容易产生语义丢失而影响到文本的情感识别精度的问题。本专利技术实施例的第一方面提供了一种对文本进行情感分类的方法，所述方法包括：对目标文本进行分词处理，得到所述目标文本的词集合；利用预设的词映射矩阵将所述词集合映射到同一多维实数空间，得到所述目标文本对应的第一文本向量，其中，所述第一文本向量的任意两个词向量单元在所述多维实数空间中的距离表示与该两个词向量单元对应的词集合中的两个词单元的相关度；对所述第一文本向量进行情感分类，确定所述...

【技术保护点】
1.一种对文本进行情感分类的方法，其特征在于，所述方法包括：对目标文本进行分词处理，得到所述目标文本的词集合；利用预设的词映射矩阵将所述词集合映射到同一多维实数空间，得到所述目标文本对应的第一文本向量，其中，所述第一文本向量的任意两个词向量单元在所述多维实数空间中的距离表示与该两个词向量单元对应的词集合中的两个词单元的相关度；对所述第一文本向量进行情感分类，确定所述目标文本的情感类别。

【技术特征摘要】
1.一种对文本进行情感分类的方法，其特征在于，所述方法包括：对目标文本进行分词处理，得到所述目标文本的词集合；利用预设的词映射矩阵将所述词集合映射到同一多维实数空间，得到所述目标文本对应的第一文本向量，其中，所述第一文本向量的任意两个词向量单元在所述多维实数空间中的距离表示与该两个词向量单元对应的词集合中的两个词单元的相关度；对所述第一文本向量进行情感分类，确定所述目标文本的情感类别。2.根据权利要求1所述的对文本进行情感分类的方法，其特征在于，在所述利用预设的词映射矩阵将所述词集合映射到同一多维实数空间之前还包括：获取训练语料，并基于获取的所述训练语料建立第一词向量矩阵；对所述第一词向量矩阵进行奇异值分解，得到第二词向量矩阵；对所述第二词向量矩阵进行降维，得到所述词映射矩阵。3.根据权利要求1所述的对文本进行情感分类的方法，其特征在于，所述利用预设的词映射矩阵将所述词集合映射到同一多维实数空间，得到所述目标文本对应的第一文本向量还包括：计算所述词集合中各词单元的权值，并基于所述各词单元的权值生成第二文本向量；利用所述词映射矩阵将所述第二文本向量映射到所述多维实数空间，得到所述第一文本向量。4.根据权利要求1至3任一项所述的对文本进行情感分类的方法，其特征在于，所述对所述第一文本向量进行情感分类，确定所述目标文本的情感类别包括：将所述第一文本向量输入已训练的情感分类器，得到所述目标文本的情感类别。5.根据权利要求4所述的对文本进行情感分类的方法，其特征在于，在所述将所述第一文本向量输入已训练的情感分类器，得到所述目标文本的情感类别之前还包括：获取已标注情感类别的训练样本；将已标注情感类别的训练样本输入预先构建的情感分类器；根据输出结果对所述预先构建的情感分类器进行参数调整，直到所述训练样本的输出结果与已标注的情感类别的接近度小于预设阈值，得到已训练的情感分类器。6.根据权利要求1至3任一...

【专利技术属性】
技术研发人员：任晓德，吴又奎，许国杰，
申请(专利权)人：中科恒运股份有限公司，
类型：发明
国别省市：河北,13

全部详细技术资料下载我是这个专利的主人