【技术实现步骤摘要】
本专利技术涉及观点挖掘领域,特别是一种基于依存关系模板抽取观点评价对象的Bootstrapping算法。
技术介绍
随着网络的快速发展,互联网上产生了一种由大量用户参与的崭新的模式—用户生成内容(Users Generate Content,UGC)模式。在UGC上用户发表对于诸如事件、产品、人物等评论信息,这些评论信息对于用户购买决策、兴趣挖掘、个性化信息服务、舆情监控、信息预测等工作都具有重要的价值和意义。然而,这些评论数量庞大,品质良莠不齐,且多为短文本描述,手工分析和挖掘异常困难,因此,设计实现面向评论的观点挖掘(opinion mining)工具成为自然语言处理和数据挖掘界的热点问题之一。目前观点挖掘算法中,基于模板匹配的方法使用得较为普遍,其本质是从样本中构造相关模板,将待分析文本与模板进行匹配从而提取需要的信息。王昌厚等将种子词出现位置的前一个词和后一个词的组合构造词形模式库用于抽取情感词。张凌等通过提取情感对象到情感词之间的一组词性模板形成词性模板库,用于提取原子情感对象。宋晓雷等利用种子词的前一个词和后一个词的词形、词性分别构造词形模板、词性模 ...
【技术保护点】
一种基于依存关系模板抽取观点评价对象的Bootstrapping算法,其特征在于:包括以下步骤:步骤S1:以情感词为中心寻找与初始依存关系模板匹配的词,并对该词进行过滤处理,获得候选观点评价对象词;步骤S2:用下式计算候选观点评价对象词j的分数:swj=Σi=1uwij*Σi=1uwijΣj=1vwiju;]]>将依存关系模板与候选观点评价对象词之间的匹配关系用二维矩阵表示:W=(wij),i={1,2,...,u},j={1,2,...,v},其中,u表示模板个数,v表示候选观点评价对象词候选个数;当第i个依存关系模块与第j个候选观点评 ...
【技术特征摘要】
1.一种基于依存关系模板抽取观点评价对象的Bootstrapping算法,其特征在于:包括以下步骤:步骤S1:以情感词为中心寻找与初始依存关系模板匹配的词,并对该词进行过滤处理,获得候选观点评价对象词;步骤S2:用下式计算候选观点评价对象词j的分数: sw j = Σ i = 1 u w i j * Σ i = 1 u ...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。