【技术实现步骤摘要】
本专利技术设及信息抽取
,更具体地说,设及一种基于结构句法的情绪原因 事件识别方法及系统。
技术介绍
随着互联网的高速发展,网络信息数据不断增加,大量信息W电子文本的形式呈 现在人们面前。而如何从运些大量的信息中迅速、准确地提取出人们所需求的重要信息就 越发重要。 信息抽取是从文本信息中自动获取所需信息的一种主要手段。信息抽取是将无结 构的文本信息,按照人们的需求识别和抽取出来,转化为结构化或半结构化的信息,并采用 数据库的形式存储,W便人们查询和进一步的分析、利用。其中,由文本信息中获取其情绪 原因事件是信息抽取中的一个重要方面,情绪原因事件是指文本信息(可W是某段语句) 中情绪的触发事件。例如,对于文本信息:1amh曰ppybee曰useIh曰vep曰ssedthetest。 该句中情绪对应的情绪词为happy,与之对应的情绪原因事件为Ihavepassedthetest。 目前,情绪原因事件识别方法大多是基于机器学习的方法,即使用统计的方法进 行研究。主要还是基于全监督的学习方法,运种方法把情绪原因事件识别看成分类问题,选 择合适的特征并 ...
【技术保护点】
一种基于结构句法的情绪原因事件识别方法,其特征在于,包括:获取预设量的训练文本,所述训练文本为已提供其情绪原因事件的文本;将所述训练文本进行分词处理,得到分别与每个所述训练文本对应的训练词组;确定所述训练词组中每个词语的结构句法特征;利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型;利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件。
【技术特征摘要】
【专利技术属性】
技术研发人员:李寿山,徐健,周国栋,
申请(专利权)人:苏州大学张家港工业技术研究院,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。