【技术实现步骤摘要】
一种基于二分超球面原型网络的事件分类方法
本专利技术属于信息抽取及推理
,具体涉及一种基于二分超球面原型网络的事件分类方法。
技术介绍
传统的事件抽取模型总是基于监督学习的,因而需要充足的训练样本,但在真实世界中大量的标记样本往往是难以获取的。而且,事件抽取的效果随着样本数的减少而减弱。但是,目前的大部分模型都假设充足的训练样本是学习事件表示必不可少的条件,这使得事件抽取任务难以取得理想的效果。因此,让模型可以在低资源的情况下抽取事件就格外重要。传统的低资源事件抽取模型主要是基于监督学习,迁移学习/预训练,或者元学习,虽然它们也可以取得不错的效果,但都是数据驱动的模型,对数据的依赖太强,而且忽略了事件本身的隐含先验信息,比如,事件之间的因果关系。从直觉上来看,建模事件之间的隐含关系有利于增强低资源事件抽取的效果,比如袭击事件包含461个实例,受伤事件包含53个实例,而袭击事件将会导致受伤事件,如果模型可以捕获这两类事件之间的因果关系,将知识从袭击因事件迁移到受伤果事件,那么将促进低资源事件的抽取效果,而且这种促 ...
【技术保护点】
1.一种基于二分超球面原型网络的事件分类方法,其特征在于,所述事件抽取方法包括以下步骤:/n获取实例,编码实例中字段的词向量和位置向量后,利用实例表示模型根据实例对应的词向量和位置向量编码得到实例表示,并通过超球面映射函数得到实例在超球面上的表示;/n根据每个事件包含的所有实例的超球面表示构建事件的原型表示;/n根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失;/n根据总损失优化实例表示模型参数和损失函数超参数,优化结束后,得到参数确定的实例表示模型和 ...
【技术特征摘要】
1.一种基于二分超球面原型网络的事件分类方法,其特征在于,所述事件抽取方法包括以下步骤:
获取实例,编码实例中字段的词向量和位置向量后,利用实例表示模型根据实例对应的词向量和位置向量编码得到实例表示,并通过超球面映射函数得到实例在超球面上的表示;
根据每个事件包含的所有实例的超球面表示构建事件的原型表示;
根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失;
根据总损失优化实例表示模型参数和损失函数超参数,优化结束后,得到参数确定的实例表示模型和优化后的原型表示;
应用时,根据参数确定的实例表示模型获得新实例的实例表示后,计算实例表示对应的超球面表示与所有优化后的原型表示的相似度,选择最高相似度对应的原型表示的事件类别为新实例的事件类别。
2.如权利要求1所述的基于二分超球面原型网络的事件分类方法,其特征在于,所述编码实例中字段的词向量和位置向量包括:
针对表示为X={xi,i∈[1,L]}的实例,xi表示实例中的第i个字段,L为实例包含的最大字段数目;
每个字段的嵌入表示x=[w,v],w表示预训练的词向量,v=[vb,ve,vl,]表示位置向量,vb,ve,vl分别表示字段到句首、句尾的距离和字段所属实例的字段长度。
3.如权利要求1所述的基于二分超球面原型网络的事件分类方法,其特征在于,所述实例表示模型为CNN、RNN、BERT模型。
4.如权利要求1所述的基于二分超球面原型网络的事件分类方法,其特征在于,根据每个事件包含的所有实例的实例表示构建事件的原型表示为:
其中,pk表示第k类事件的原型表示...
【专利技术属性】
技术研发人员:陈华钧,邓淑敏,张宁豫,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。