当前位置: 首页 > 专利查询>北京大学专利>正文

一种判定评论文本极性的方法及其应用技术

技术编号:8161569 阅读:195 留言:0更新日期:2013-01-07 19:34
本发明专利技术公布了一种判定评论文本极性的方法,所述方法可以应用于网络舆情监控。将评论文本用汉语分词工具进行分词和词性标注;根据词性标注结果,选出形容词集合;对形容词集合中的单词分别进行形容词极性判定;比较正极性单词的个数与负极性单词的个数:如果正极性单词的个数大于负极性单词的个数,则判定该评论文本为正面评价;如果正极性单词的个数等于负极性单词的个数,则判定该评论文本为中立评价;如果正极性单词的个数小于负极性单词的个数,则判定该评论文本为负面评价。本工作主要从语言学的角度来考察极性的非对称性,并将这些非对称性应用到自然语言处理的情感分析中。“不”、“有点”两个极性指示器具有充分的语言学解释。

【技术实现步骤摘要】

本专利技术提供ー种判定评论文本的极性的方法,具体涉及ー种形容词的极性判定方法,属于计算语言学领域,该方法可以应用于网络舆情监控。
技术介绍
网络舆情监测是ー项重要的工作。对于网上发布的各种新闻事件所产生的影响进行分析,有助于及时正确地进行相应处理。在很多情况下,针对某个新闻事件,我们希望了解究竟是正面评价多还是负面评价多。比如,以下一则新闻(见图1,详见http://edU.sina. com. cn/gaokao/2012-06-28/1700346332. shtml)引起了网民的热烈评论。·为了获得正负面评论的比例,传统的作法是采用人工分析。比如说,根据人工阅读判断得知,对该新闻中“文史哲祸害社会”论调的态度分布分别是66%不同意、24%同意,此外10%持中立态度。人工对评论文本进行极性分类的准确度较高,但是极为耗时,不利于大批量的文本处理。本文提出的方法,首先对评论文本中出现的形容词进行极性判定,然后再根据判定的结果对热点新闻的评论文本进行极性判定,确定该评论文本是正面评论、负面评论还是中性评论。需要指出,本文采用的方法,完全自动完成,适合大批量文本处理。本专利技术中用来判本文档来自技高网...

【技术保护点】
一种判定形容词极性的方法,其特征是,对于给定形容词word,判断其极性的步骤如下:1)在搜索引擎中用精确匹配模式查找“不word”,记下返回结果数目,得到hits(“不word”);2)在搜索引擎中用精确匹配模式查找“有点word”,记下返回结果数目,得到hits(“有点word”);3)在搜索引擎中用精确匹配模式查找“不”,记下返回结果数目,得到hits(“不”);4)在搜索引擎中用精确匹配模式查找“有点”,记下返回结果数目,得到hits(“有点”);5)计算word的极性SO?PMI?IR:6)若极性SO?PMI?IR(word)>0,则word为正极性,否则word为负极性;其中,hit...

【技术特征摘要】

【专利技术属性】
技术研发人员:徐戈王厚峰
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1