【技术实现步骤摘要】
一种文本情感识别方法、装置、存储介质及电子设备
本申请涉及文本情感分析
,尤其涉及一种文本情感识别方法、装置、存储介质及电子设备。
技术介绍
随着社交网络的快速发展,越来越多的人通过社交网络对社会事件、产品、服务等发表评论、表达观点。在实际应用中,新产品或服务上线后,商家需要利用社交网络数据分析用户的喜好和态度,进而判断产品或服务的优劣并进行改进;新政策或法规颁布后,政府部门需要利用社交网络数据分析人群的情感倾向,为后续政策或法规完善提供依据;热点事件爆发后,相关职能部门或公共服务部门需要利用社交网络数据分析人群的态度倾向,进而为舆论正确引导提供技术支撑。因此,利用海量社交网络数据开展情感分析技术研究具有重要意义。当前,社交网络数据呈现出以下两个特点:一是文本简短,以Weibo、Twitter为代表的社交网络平台,单条博文的字数有限,提高了分析挖掘的难度。二是文本中大量使用表情符号,一方面表情符号对文本内容语义具有补充、增强等作用,另一方面表情符号增加了语言的生动性。基于社交网络数据的上述特点,采用传统的文本分 ...
【技术保护点】
1.一种文本情感识别方法,其特征在于,包括:/n获取针对指定事件的目标数据信息;所述目标数据信息中包括文本数据和表情符号;/n分别确定所述文本数据的各个目标分词的词向量和所述表情符号的表情词向量;/n结合各个目标分词的词向量和所述表情符号的表情词向量,确定所述目标数据信息所属的情感类别。/n
【技术特征摘要】
1.一种文本情感识别方法,其特征在于,包括:
获取针对指定事件的目标数据信息;所述目标数据信息中包括文本数据和表情符号;
分别确定所述文本数据的各个目标分词的词向量和所述表情符号的表情词向量;
结合各个目标分词的词向量和所述表情符号的表情词向量,确定所述目标数据信息所属的情感类别。
2.根据权利要求1所述的方法,其特征在于,确定所述文本数据的各个目标分词的词向量,包括:
对所述文本数据进行分词处理,根据得到的分词确定文本数据的各个目标分词;
采用词向量模型将各个目标分词转换为词向量。
3.根据权利要求2所述的方法,其特征在于,所述根据得到的分词确定文本数据的各个目标分词,包括:
去除得到的分词中的停用词,将剩余的分词作为目标分词;或者,
根据得到的每个分词在所述文本数据中的重要度,去除部分分词,将剩余的分词作为目标分词;
若得到的目标分词少于设定数量,采用目标分词的同义词将目标分词扩充至设定数量。
4.根据权利要求1所述的方法,其特征在于,确定所述表情符号的表情词向量,包括:
获取所述表情符号对应的语义关键词以及各个语义关键词对应的权重;
根据各个语义关键词对应的权重,将各个语义关键词的词向量进行加权求和,得到所述表情符号的表情词向量。
5.根据权利要求1所述的方法,其特征在于,结合各个目标分词的词向量和所述表情符号的表情词向量,确定所述目标数据信息所属的情感类别,包括:
将各个目标分词的词向量和所述表情符号的表情词向量进行融合,得到所述目标数据信息对应的特征矩阵;
根据所述目标数据信息对应的特征矩阵,确定所述目标数据信息所属的情感类别。
6.根据权利要求1所述的方法,其特征在于,结合各个目标分词的词向量和所述表情符号的表情词向量,确定所述目标数据信息所属的情感类别,包括:
将各个目标分词的词向量和所述表情符号的表情词向量输入已训练的卷积神经网络模型,得到所述卷积神经网络模型输出的所述目标数据信息所属的情感类别;所述卷积神经网络模型...
【专利技术属性】
技术研发人员:王晓悦,马行空,刘冰,王勇军,李军,解培岱,许方亮,石浩辛,陈科,江金寿,田建辉,叶金华,何圣华,
申请(专利权)人:中国兵器科学研究院,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。