【技术实现步骤摘要】
本专利技术涉及一种对自然语言的语义分析的方法,尤其涉及一种对自然语言句子的语义角色进行分析和标注的方法,属于计算语言学中的自然语言处理领域。
技术介绍
语义分析是自然语言处理的一个关键问题。作为目前的热点研究课题之一,语义角色标注(Semantic Role Labeling,SRL)是浅层语义分析(ShallowSemantic Parsing)的一种,其实质是在句子级别进行浅层的语义分析。所谓语义角色标注,就是对于给定句子,对句中的每个谓词标注出句中的相应语义成分,并作相应的语义标记,如施事、受事、工具或附加语等。SRL能应用于问答系统、信息抽取、文本摘要、文本蕴含等领域,具有广泛的应用前景。基于机器学习的语义角色标注通常可分为四个阶段:a)预处理,通常过滤掉不可能成为语义角色的句法成分;b)语义成分识别,识别出哪些标注单元是某一目标谓词的语义角色;c)语义角色分类,为识别语义成分的单元进行语义角色的分类;d)后处理,对标注的语义角色进行全局优化,确定合理的角色组合。其中,识别和分类阶段一般使用局部推导。所谓局部推导是指独立决定句中每个成分的语义标签,而不依赖于其他成分的标注,这样训练得到的模型称为局部模型。相应地,全局推导一般发生在后处理阶段。所谓全局推导是指在局部推导的基础上,考虑各成分标签之间的依赖关系,通过全局模型集成相关硬限制和软约束条件,从而得到合理的语义角色组合。通常,合理地集成局部模型和全局模型,能大大提高系统的性能和健壮性。局部模型的学习方法通常可分为两类:基于特征向量的方法和基于核函数的方法。从目前而言,基于特征向量的方法,取得了 ...
【技术保护点】
一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注,包括如下步骤: (1)生成语义角色标注模型: 生成训练文件:从标注语料库中,根据下表中的特征抽取特征,生成所需的训练文件; *** 位置 路径 中心词及其词性 谓词 子类框架 句法成分类型 句法成分首词和尾词 句法成分左兄弟结点类型 谓词语法框架 动词类别 句法成分前一个词 句法成分父亲结点类型 压缩路径 句法成分是否有右兄弟结点 句法成分左兄弟结点中心词类型 修改的路径 路径中是否存在根结点 模型生成:利用训练文件对最大熵分类器模型进行训练,得到语义角色标注模型文件; (2)生成联合学习模型: 提取训练语料:从树库中,提取出句法分析训练语料,句 法分析的训练事件中包含语义特征; 生成训练文件:在句法分析模型常用特征基础上,添加语义特征,生成训练文件; 所述句法分析模型常用特征由下表表示: 第n棵树的中心词、成分标记和决策标记 第n棵树的中心词词性、成分标记和 ...
【技术特征摘要】
1.一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注,包括如下步骤:(1)生成语义角色标注模型:生成训练文件:从标注语料库中,根据下表中的特征抽取特征,生成所需的训练文件; 位置路径中心词及其词性谓词子类框架句法成分类型句法成分首词和尾词句法成分左兄弟结点类型谓词语法框架动词类别句法成分前一个词句法成分父亲结点类型 压缩路径句法成分是否有右兄弟结 点 句法成分左兄弟结点中 心词类型 修改的路径路径中是否存在根结点模型生成:利用训练文件对最大熵分类器模型进行训练,得到语义角色标注模型文件;(2)生成联合学习模型:提取训练语料:从树库中,提取出句法分析训练语料,句法分析的训练事件中包含语义特征;生成训练文件:在句法分析模型常用特征基础上...
【专利技术属性】
技术研发人员:王红玲,朱巧明,钱培德,孔芳,李培峰,周国栋,钱龙华,
申请(专利权)人:苏州大学,
类型:发明
国别省市:32[中国|江苏]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。