事件检测方法技术

技术编号：21089808 阅读：64 留言：0更新日期：2019-05-11 10:02

本发明专利技术提供一种事件检测方法。所述方法包括：使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用；计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。本发明专利技术通过动态缩放负例样本的训练权重，能够解决现有事件检测模型中的类别不平等问题，且不需要引入任何额外的模型参数。

Event Detection Method

全部详细技术资料下载

【技术实现步骤摘要】
事件检测方法
本专利技术涉及自然语言处理
，尤其涉及一种事件检测方法。
技术介绍
事件抽取是信息抽取中的一个关键任务，事件检测则是事件抽取中的一个关键步骤。事件检测的目标是从给定的文本中识别出特定事件类别的触发词。例如，给定句子“亨利受伤了”，一个事件检测系统应当能够识别出“受伤”是一个“伤害”类别事件的触发词。现有的神经网络模型通常将事件检测转化为一个词级别的分类问题，例如，在句子中“亨利受伤了”中，一个事件检测系统通过将上述句子中的三个词分别分类为“空”，“伤害事件”以及“空”，从而完成事件检测任务。这类的模型对先验信息的依赖较小，并且已经在事件检测领域取得了较大的进展。在实现本专利技术的过程中，专利技术人发现现有技术中至少存在如下技术问题：现有的事件检测方法存在着显著的类别不平等问题，这种类别不平等主要体现在数据分布以及使用的评价指标上，具体来说，在数据分布上，被标记为“空”的样本数量显著性地多于被标记为特定类别事件样本的样本数量，在评价指标上，通常使用在事件类别上的F值作为评价标准，而这种评价标准中对于“空”类别上的正确预测结果常常被忽略。由此可见，由于上述的类别不平等问题的存在，使得现有的事件检测模型无法得到良好结果。
技术实现思路
本专利技术提供的事件检测方法，通过动态缩放负例样本的训练权重，能够解决现有事件检测模型中的类别不平等问题，且不需要引入任何额外的模型参数。第一方面，本专利技术提供一种事件检测方法，包括：使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用；计...

【技术保护点】
1.一种事件检测方法，其特征在于，包括：使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用；计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。

【技术特征摘要】
1.一种事件检测方法，其特征在于，包括：使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用；计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。2.根据权利要求1所述的方法，其特征在于，所述使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数，以计算所述F值评价指标对正例样本和负例样本的边际效用通过以下计算公式实现：其中，和分别是所述F值评价指标对正例样本的边际效用和所述F值评价指标对负例样本的边际效用，分别用于表示正例样本和负例样本对所述F值评价指标的相对重要性，β是所述F值评价指标中用于平衡准确率与召回率的参数，P和N分别表示训练数据中的正例样本总数量和负例样本总数量，TP和TN分别表示正确预测的正例样本数量和正确预测的负例样本数量，PE表示一个正例样本类别与另一个正例样本类别之间的预测错误。3.根据权利要求2所述的方法，其特征在于，所述计算负例样本在事件检测模型...

【专利技术属性】
技术研发人员：林鸿宇，韩先培，孙乐，陆垚杰，
申请(专利权)人：中国科学院软件研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人