当前位置: 首页 > 专利查询>闽江学院专利>正文

一种基于依存关系模板抽取观点评价对象的Bootstrapping方法技术

技术编号:14313363 阅读:243 留言:0更新日期:2016-12-30 14:29
本发明专利技术涉及一种基于依存关系模板抽取观点评价对象的Bootstrapping算法,考虑了情感词与观点评价对象词之间的语法、语义关系,构造观点评价对象词与情感词之间的依存关系模板,采用Bootstrapping方法抽取观点评价对象。本发明专利技术避免了直接采用词汇上下文抽取评价对象方法所带来的噪音,提高了观点评价对象抽取性能。

【技术实现步骤摘要】

本专利技术涉及观点挖掘领域,特别是一种基于依存关系模板抽取观点评价对象的Bootstrapping算法。
技术介绍
随着网络的快速发展,互联网上产生了一种由大量用户参与的崭新的模式—用户生成内容(Users Generate Content,UGC)模式。在UGC上用户发表对于诸如事件、产品、人物等评论信息,这些评论信息对于用户购买决策、兴趣挖掘、个性化信息服务、舆情监控、信息预测等工作都具有重要的价值和意义。然而,这些评论数量庞大,品质良莠不齐,且多为短文本描述,手工分析和挖掘异常困难,因此,设计实现面向评论的观点挖掘(opinion mining)工具成为自然语言处理和数据挖掘界的热点问题之一。目前观点挖掘算法中,基于模板匹配的方法使用得较为普遍,其本质是从样本中构造相关模板,将待分析文本与模板进行匹配从而提取需要的信息。王昌厚等将种子词出现位置的前一个词和后一个词的组合构造词形模式库用于抽取情感词。张凌等通过提取情感对象到情感词之间的一组词性模板形成词性模板库,用于提取原子情感对象。宋晓雷等利用种子词的前一个词和后一个词的词形、词性分别构造词形模板、词性模板用于抽取观点评价对本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201610537567.html" title="一种基于依存关系模板抽取观点评价对象的Bootstrapping方法原文来自X技术">基于依存关系模板抽取观点评价对象的Bootstrapping方法</a>

【技术保护点】
一种基于依存关系模板抽取观点评价对象的Bootstrapping算法,其特征在于:包括以下步骤:步骤S1:以情感词为中心寻找与初始依存关系模板匹配的词,并对该词进行过滤处理,获得候选观点评价对象词;步骤S2:用下式计算候选观点评价对象词j的分数:swj=Σi=1uwij*Σi=1uwijΣj=1vwiju;]]>将依存关系模板与候选观点评价对象词之间的匹配关系用二维矩阵表示:W=(wij),i={1,2,...,u},j={1,2,...,v},其中,u表示模板个数,v表示候选观点评价对象词候选个数;当第i个依存关系模块与第j个候选观点评价对象词存在匹配关系...

【技术特征摘要】
1.一种基于依存关系模板抽取观点评价对象的Bootstrapping算法,其特征在于:包括以下步骤:步骤S1:以情感词为中心寻找与初始依存关系模板匹配的词,并对该词进行过滤处理,获得候选观点评价对象词;步骤S2:用下式计算候选观点评价对象词j的分数: sw j = Σ i = 1 u w i j * Σ i = 1 u ...

【专利技术属性】
技术研发人员:杨晓燕徐戈
申请(专利权)人:闽江学院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1