一种判定评论文本极性的方法及其应用技术

技术编号：8161569 阅读：195 留言：0更新日期：2013-01-07 19:34

本发明专利技术公布了一种判定评论文本极性的方法，所述方法可以应用于网络舆情监控。将评论文本用汉语分词工具进行分词和词性标注；根据词性标注结果，选出形容词集合；对形容词集合中的单词分别进行形容词极性判定；比较正极性单词的个数与负极性单词的个数：如果正极性单词的个数大于负极性单词的个数，则判定该评论文本为正面评价；如果正极性单词的个数等于负极性单词的个数，则判定该评论文本为中立评价；如果正极性单词的个数小于负极性单词的个数，则判定该评论文本为负面评价。本工作主要从语言学的角度来考察极性的非对称性，并将这些非对称性应用到自然语言处理的情感分析中。“不”、“有点”两个极性指示器具有充分的语言学解释。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术提供ー种判定评论文本的极性的方法，具体涉及ー种形容词的极性判定方法，属于计算语言学领域，该方法可以应用于网络舆情监控。
技术介绍
网络舆情监测是ー项重要的工作。对于网上发布的各种新闻事件所产生的影响进行分析，有助于及时正确地进行相应处理。在很多情况下，针对某个新闻事件，我们希望了解究竟是正面评价多还是负面评价多。比如，以下一则新闻(见图1，详见http://edU.sina. com. cn/gaokao/2012-06-28/1700346332. shtml)引起了网民的热烈评论。·为了获得正负面评论的比例，传统的作法是采用人工分析。比如说，根据人工阅读判断得知，对该新闻中“文史哲祸害社会”论调的态度分布分别是66%不同意、24%同意，此外10%持中立态度。人工对评论文本进行极性分类的准确度较高，但是极为耗时，不利于大批量的文本处理。本文提出的方法，首先对评论文本中出现的形容词进行极性判定，然后再根据判定的结果对热点新闻的评论文本进行极性判定，确定该评论文本是正面评论、负面评论还是中性评论。需要指出，本文采用的方法，完全自动完成，适合大批量文本处理...

【技术保护点】
一种判定形容词极性的方法，其特征是，对于给定形容词word，判断其极性的步骤如下：1)在搜索引擎中用精确匹配模式查找“不word”，记下返回结果数目，得到hits(“不word”)；2)在搜索引擎中用精确匹配模式查找“有点word”，记下返回结果数目，得到hits(“有点word”)；3)在搜索引擎中用精确匹配模式查找“不”，记下返回结果数目，得到hits(“不”)；4)在搜索引擎中用精确匹配模式查找“有点”，记下返回结果数目，得到hits(“有点”)；5)计算word的极性SO？PMI？IR：6)若极性SO？PMI？IR(word)>0，则word为正极性，否则word为负极性；其中，hit...

【技术特征摘要】

【专利技术属性】
技术研发人员：徐戈，王厚峰，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人