当前位置: 首页 > 专利查询>闽江学院专利>正文

一种基于依存关系抽取评价对象的方法技术

技术编号:16819080 阅读:59 留言:0更新日期:2017-12-16 12:30
本发明专利技术涉及一种基于依存关系抽取评价对象的方法。包括:S1、定义观点评价对象词与情感词之间的依存关系;S2、基于步骤S1定义的观点评价对象词与情感词之间的依存关系,构建观点评价对象词与情感词之间的直接依存关系模板和间接依存关系模板;S3、基于依存关系模板抽取观点评价对象的Bootstrapping算法。本发明专利技术方法相对于最新的方法性能上有较大提高。

A method of extracting evaluation objects based on dependency relationship

The invention relates to a method of extracting evaluation objects based on dependency relationship. Including: the dependency relation between S1 and define the view of evaluation object words and emotional words; S2, dependency relation between step S1 definition evaluation object words and emotional words based on the construction of the evaluation object point of view between words and emotional words of the direct and indirect dependency relation dependency relation template template; S3 Bootstrapping algorithm, dependency relation template extraction based on the view of the evaluation object. The method of the invention is greatly improved in performance compared with the latest method.

【技术实现步骤摘要】
一种基于依存关系抽取评价对象的方法
本专利技术涉及一种基于依存关系抽取评价对象的方法。
技术介绍
1、观点评价对象抽取的国内外研究现状目前观点评价对象抽取算法可以归结为监督的机器学习(supervisedmachinelearning)、无监督的机器学习(unsupervisedmachinelearning)、半监督的机器学习(semi-supervisedlearning)。监督的机器学习方法将观点评价对象抽取问题看成是标注问题。这方面的代表方法有张磊[7]引入词形、词性、依存关系结构、距离、路径等特征模板,利用最大熵模型进行训练,提取观点评价对象-情感词对。袁璐[8]对句子进行浅层句法分析并制定相应规则,再结合隐马尔科夫模型进行训练。戴敏[9]引入词形、依存关系、语义角色标注等特征基于条件随机场模型进行观点评价对象抽取。以上方法均采用监督学习的方法进行观点评价对象识别,这些方法需要标注大量的训练数据,费时费力,而且不同领域的训练数据无法共享,这大大影响了监督机器学习方法的适用性。无监督机器学习方法抽取观点评价对象主要采用模板和规则两种方法[10-13]。Hu[10]基于Apio本文档来自技高网...
一种基于依存关系抽取评价对象的方法

【技术保护点】
一种基于依存关系抽取评价对象的方法,其特征在于:包括如下步骤,S1、定义观点评价对象词与情感词之间的依存关系;S2、基于步骤S1定义的观点评价对象词与情感词之间的依存关系,构建观点评价对象词与情感词之间的直接依存关系模板和间接依存关系模板;S3、基于依存关系模板抽取观点评价对象的Bootstrapping算法。

【技术特征摘要】
1.一种基于依存关系抽取评价对象的方法,其特征在于:包括如下步骤,S1、定义观点评价对象词与情感词之间的依存关系;S2、基于步骤S1定义的观点评价对象词与情感词之间的依存关系,构建观点评价对象词与情感词之间的直接依存关系模板和间接依存关系模板;S3、基于依存关系模板抽取观点评价对象的Bootstrapping算法。2.根据权利要求1所述的一种基于依存关系抽取评价对象的方法,其特征在于:所述步骤S1具体实现如下:(1)定义观点评价对象词与情感词之间的直接依存关系,即:观点评价对象词与情感词之间存在依存关系,且在依存路径上没有依赖其他词;观点评价对象词与情感词之间的直接依存关系包括:父亲关系、儿子关系;(2)定义观点评价对象词与情感词之间的间接依存关系,即:观点评价对象词与情感词通过其他词产生依存关系;观点评价对象词与情感词之间的间接依存关系包括:兄弟关系、夫妻关系、祖父关系、孙子关系、远亲关系。3.根据权利要求2所述的一种基于依存关系抽取评价对象的方法,其特征在于:所述步骤S2具体实现如下:根据观点评价对象词与情感词之间的直接依存关系,构建观点评价对象词与情感词之间的直接依存关系模板,具体表示为(dp,target,relate,opinion),其中:dp表示观点评价对象词与情感词之间的依存关系;target指观点评价对象词;relate表示观点评价对象词与情感词之间的依存关系形式,并用-1表示观点评价对象词是情感词的父亲节点,用+1表示观点评价对象词是情感词的儿子节点;opinion指情感词;根据观点评价对象词与情感词之间的间接依存关系,构建观点评价对象词与情感词之间的间接依存关系模板,具体表示为(dp1,target,relate1,middle1)+…+(dpk-1,middlek-1,relatek-1,middlek)+(dpk,middlek,relatek,opinion),其中:dp1表示第1个观点评价对象词与第1个中间词的依存关系;relate1表示第1个观点评价对象词与第1个中间词之间的依存关系形式,用-1或+1表示;middlek指第k个中间词;dpk表示第k个情感词与第k个中间词的依存关系;relatek表示第k个情感词与第k个中间词的依存关系形式,用-1或+1表示。4.根据权利要求3所述的一种基于依存关系抽取评价对象的方法,其特征在于:所述步骤S3具体实现如下:S31、候选观点评价对象词预处理:(1)词性过滤:仅将名词或名词短语作为候选评价对象词;(2)停用词过...

【专利技术属性】
技术研发人员:杨晓燕
申请(专利权)人:闽江学院
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1