【技术实现步骤摘要】
一种基于论元结构的事件观点挖掘方法
[0001]本专利技术涉及观点挖掘任务,特别是涉及以事件为中心的观点挖掘任务,属于自然语言处理
技术介绍
[0002]观点挖掘是自然语言处理中的一个关键任务,旨在从给定的文本中识别人们对于实体、事件及其子结构的观点和情感。例如,给定句子“XX手机的速度很快”,一个观点挖掘系统应当能够识别出“很快”是作者针对“XX手机”的“速度”的观点。
[0003]近年来,由于事件的结构难以划分,人们专注于基于实体及其属性的观点挖掘,将其定义为从给定的文本中提取(属性,观点,类型,情感)四元组。例如,在句子“XX手机的速度很快”中,一个以实体为中心的观点挖掘系统将提取出(“速度”,“很快”,性能,正面)的观点四元组。以实体为中心的观点挖掘任务从观点或属性单元素提取发展到四元组提取,已经发展的比较成熟。
[0004]然而,以实体为中心的观点挖掘任务的任务定义和模型都不能直接应用到以事件为中心的观点挖掘任务当中。首先,以实体为中心的观点主要关注观点持有者的情感极性,而以事件为中心的观 ...
【技术保护点】
【技术特征摘要】
1.一种基于论元结构的事件观点挖掘方法,其步骤包括:1)对于给定的事件e和文档d,从文档d中提取所有与给定事件e有关的观点片段;2)针对每一所述观点片段,从事件e中提取表达观点的事件子结构作为对应所述观点片段的观点对象;3)根据步骤2)的处理结果,得到事件e的事件观点集合T={
…
,(o
k
,a
k
),
…
|e,d};其中,o
k
是文档d中的第k个观点片段;a
k
是观点o
k
对应的观点对象。2.根据权利要求1所述的方法,其特征在于,所述观点片段的观点对象包括事件本身、事件子事件和事件参与者。3.根据权利要求2所述的方法,其特征在于,所述事件本身是指观点片段直接针对整个事件发表看法;所述事件子事件是指观点片段针对事件的子事件或相关事件发表看法;所述参与者是指观点片段直接针对事件当中涉及的实体发表看法。4.根据权利要求1或2或3所述的方法,其特征在于,从文档d中提取所有与给定事件e有关的观点片段的方法为:1)将给定事件e和文档d中的每一句使用BERT的通用拼接符号拼接,构造输入:[CLS]事件短语[SEP]文档句子[SEP];2)将拼接后的文本输入Transformer编码器;3)将起始符号[CLS]对应的表示输入Softmax层进行分类,如果输出结果为1,那么对应句子为与事件e相关的观点句;如果输出结果为0,则不是与事件e相关的观点句;4)将文档d中连续的观点句连接起来得到...
【专利技术属性】
技术研发人员:徐若曦,林鸿宇,韩先培,孙乐,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。