【技术实现步骤摘要】
本专利技术提供ー种判定评论文本的极性的方法,具体涉及ー种形容词的极性判定方法,属于计算语言学领域,该方法可以应用于网络舆情监控。
技术介绍
网络舆情监测是ー项重要的工作。对于网上发布的各种新闻事件所产生的影响进行分析,有助于及时正确地进行相应处理。在很多情况下,针对某个新闻事件,我们希望了解究竟是正面评价多还是负面评价多。比如,以下一则新闻(见图1,详见http://edU.sina. com. cn/gaokao/2012-06-28/1700346332. shtml)引起了网民的热烈评论。·为了获得正负面评论的比例,传统的作法是采用人工分析。比如说,根据人工阅读判断得知,对该新闻中“文史哲祸害社会”论调的态度分布分别是66%不同意、24%同意,此外10%持中立态度。人工对评论文本进行极性分类的准确度较高,但是极为耗时,不利于大批量的文本处理。本文提出的方法,首先对评论文本中出现的形容词进行极性判定,然后再根据判定的结果对热点新闻的评论文本进行极性判定,确定该评论文本是正面评论、负面评论还是中性评论。需要指出,本文采用的方法,完全自动完成,适合大批量文本处理 ...
【技术保护点】
一种判定形容词极性的方法,其特征是,对于给定形容词word,判断其极性的步骤如下:1)在搜索引擎中用精确匹配模式查找“不word”,记下返回结果数目,得到hits(“不word”);2)在搜索引擎中用精确匹配模式查找“有点word”,记下返回结果数目,得到hits(“有点word”);3)在搜索引擎中用精确匹配模式查找“不”,记下返回结果数目,得到hits(“不”);4)在搜索引擎中用精确匹配模式查找“有点”,记下返回结果数目,得到hits(“有点”);5)计算word的极性SO?PMI?IR:6)若极性SO?PMI?IR(word)>0,则word为正极性,否则word为 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。