【技术实现步骤摘要】
情感分类方法及装置
[0001]本公开涉及自然语言处理
,尤其涉及一种情感分类方法及装置。
技术介绍
[0002]随着终端移动设备的智能化和交互技术的高速发展,使得人们的在线交流沟通更加高效与频繁,人们越来越习惯通过互联网来表达自己的所思所想,发表自己的观点,例如在短视频平台下发表自己的看法及态度,表达自己的心情,如何从互联网中的文本信息中分析出信息发布者的情感倾向,是自然语言处理
的重要内容之一。
[0003]当前,文本情感分析方法主要有基于情感词典的情感分析方法、基于传统机器学习的情感分析方法。基于情感词典的情感分析方法,主要依赖情感词典的构建,在信息爆炸的今天,各种网络流行语、谐音语、双关语等新词语层出不穷,这就要求情感词典不断扩充才能保证分析的正确率;而基于传统机器学习的情感分析方法,往往过度依赖文本情感特征的提取以及分类器的设计。在此种技术实现下,仅从文本特征角度分析,导致情感分析的特征维度较为单一,不能准确定位语境信息,进而造成情感分类预测的准确率不高。
技术实现思路
[0004]本公开提供一种情感分类方法及装置,能够在情感分类过程中,从多个特征维度进行情感预测分析,并对文本特征进行情感增强处理,从而可准确定位语境信息,提升情感分类的预测准确率。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种情感分类方法,包括:
[0006]提取包含字符文本以及表情文本的评论文本数据;
[0007]将所述评论文本数据输入预设语言模型,得到 ...
【技术保护点】
【技术特征摘要】
1.一种情感分类方法,其特征在于,包括:提取包含字符文本以及表情文本的评论文本数据;将所述评论文本数据输入预设语言模型,得到所述字符文本的第一特征向量和所述表情文本的第二特征向量,其中,所述预设语言模型为利用未标注任务标签的第一样本评论文本数据进行预训练,以及利用标注任务标签的第二样本评论文本数据进行微调得到的语言表征模型;根据预设情感词典对所述第一特征向量进行情感增强处理,得到所述字符文本的第三特征向量;将所述第三特征向量和所述第二特征向量的拼接特征向量,输入所述预设语言模型中的全连接层,得到所述评论文本数据对应的情感分类结果。2.根据权利要求1所述的方法,其特征在于,所述提取包含字符文本以及表情文本的评论文本数据,包括:获取包含初始字符文本以及至少一个初始表情文本的初始评论文本数据;对所述初始评论文本数据进行预处理,得到所述包含字符文本以及表情文本的评论文本数据;其中,所述预处理包括:在所述初始字符文本中滤除无意义文本,以及保留所述至少一个初始表情文本中符合预设条件的初始表情文本。3.根据权利要求2所述的方法,其特征在于,所述保留所述至少一个初始表情文本中符合预设条件的初始表情文本之前,还包括:统计所述至少一个初始表情文本中每个初始表情文本在所述初始评论文本数据中的累计出现次数,以及获取所述每个初始表情文本的情感属性值;基于所述累计出现次数和所述情感属性值中的至少一个指标,从所述至少一个初始表情文本中确定出符合所述预设条件的初始表情文本。4.根据权利要求1所述的方法,其特征在于,所述将所述评论文本数据输入预设语言模型,得到所述字符文本的第一特征向量和所述表情文本的第二特征向量,包括:对所述评论文本数据中的所述字符文本和所述表情文本分别单独进行遮盖处理;将遮盖所述字符文本后的评论文本数据输入预设语言模型,得到所述字符文本的第一特征向量;将遮盖所述表情文本后的评论文本数据输入预设语言模型,得到所述表情文本的第二特征向量。5.根据权利要求1所述的方法,其特征在于,所述第一特征向量包含所述字符文本中各个字符对应的字符向量;所述根据预设情感词典对所述第一特征向量进行情感增强处理,得到所述字符文本的第三特征向量,包括:对所述第一特征向量中的各个字符向量进行线性组合处理,得到多个文本片段的空间向量;根据所述预设情感词典确定各个文本片段的最终权重值,根据所述各个文本片段的最终权重值,对所述多个文本片段的空间向量进行加权处理,得到所述字符文本的第三特征向量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述预设情感词典确定各个文本片段的最终权重值,包括:确定各个文本片段的初始权重值;针对每个文本片段,获取所述文本片段与所述预设情感词典的匹配结果,并根据所述匹配结果对所述初始权重值进行增权处理,得到所述各个文本片段的最终权重值。7.根据权利要求1所述的方法,其特征在于,所述预设语言模型中的全连接层包含有预设数量个层级节点,每个层级节点表示一种情感极性;所述将所述第三特征向量和所述第二特征向量的拼接特征向量,输入所述预设语言模型中的全连接层,得到所述评论文本数据对应的情感...
【专利技术属性】
技术研发人员:马延振,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。