The invention provides a method for accurately extracting emotion information of network texts. Including the following steps: (1) the detection of emotion in text symbols, abbreviations, acronyms, Interjections and other special symbols; (2) to preprocess the text with a professional parser, get the basic syntactic relations of a sentence; (3) to separate the words in the sentence analysis, given the emotional vector (4; according to the different types of phrases), according to the corresponding emotional rules, get emotional phrase vector; (5) according to the different types of sentences, phrases with emotion vector, get emotional final sentence vector. The network text sentiment extraction method based on the invention can comprehensively and precisely identify the emotion type, and has higher accuracy rate.
【技术实现步骤摘要】
本专利技术涉及一种网络文本情感信息提取方法,主要涉及自然语言处理领域以及情 感计算领域。
技术介绍
自然语言是人类特有的交流手段之一,而随着互联网的发展,自然语言也成为网 络交流的重要手段,并逐渐衍生出一种新兴的语言方式网络语言。网络文本信息蕴含着丰 富的情感信息,对应着用户相应的心理状态,因此文本情感提取的研究在情感计算和智能 交互领域有着重要意义。它使计算机能够从文本信息中体会人类的喜怒哀乐并做出恰当的 反应,可用于人机对话系统、仿生代理交互系统。而如何能够准确有效的对用户输入语言进 行情感识别并分类,已成为人机交互和个性化计算机领域面临的一个巨大挑战。而现在汉语自然语言处理技术涉及到情感信息的领域只有语义倾向计算,即褒贬 二义识别。这对于准确分析用户行为及理解用户情感是远远不够的。此外,网络语言具有 如下特征(1)无复杂的句式( 重在速度而非正确拼写C3)多使用网络流行语(4)频繁使 用情感符、缩写、缩略,针对这些特征必须建立起相应的文本处理模型才能准确识别用户表 达的情感。情感计算模型是人机情感交互的关键组成部分,其基础和根本是对自然情绪实 质的理解和表 ...
【技术保护点】
1.一种基于语义及情感计算的网络文本情感信息提取方法,包括以下步骤:(1)检测文本中的情感符、缩写、缩略、感叹词等特殊符号;(2)利用汉语词法分析系统ICTCLAS2011对文本进行预处理,得到句子基本句法关系;(3)对句子中分离出来的词进行分析,从情感语料库中获取相应的六维情感向量;(4)根据不同短语的类型,根据相应的情感规则,得到短语六维情感向量;(5)根据句子的不同类型,结合短语情感向量,得到句子最终的六维情感向量。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。