System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 事件分类模型的训练方法、使用方法、装置及介质制造方法及图纸_技高网

事件分类模型的训练方法、使用方法、装置及介质制造方法及图纸

技术编号:40946243 阅读:3 留言:0更新日期:2024-04-18 15:04
本申请提供一种事件分类模型的训练方法、使用方法、装置及介质,涉及数据处理技术领域;该训练方法包括:获取文章数据的关键句子集合;按照预设层面从关键句子集合中提取文章整体特征,以得到支持集;预设层面包括关键句子与文章标题的关联度,以及关键句子与事件描述信息的关联度,事件描述信息是对相应预设事件类型的描述;基于原型表征和事件描述表征,确定类向量;事件描述表征是基于事件描述信息得到的,类向量是预设事件类型的表征;根据支持集和类向量,对原始分类模型进行训练,以得到训练好的事件分类模型。本申请的方法,用于使事件分类模型在少样本场景下也能很好地进行事件分类。

【技术实现步骤摘要】

本申请涉及数据处理技术,尤其涉及一种事件分类模型的训练方法、使用方法、装置及介质


技术介绍

1、事件分类是将事件按照其特征、性质或其他相关标准进行分组或归类的过程。通过事件分类,可以发现领域中大量的事件数据,从而使其更易于管理、分析和处理。

2、目前,监督学习范式下的事件分类方法需要大量标注数据,来实现在输入待分类事件时,能够输出对应的事件类别。在此基础上,在新的事件类型出现时,由于缺少标注数据,导致如何在输入待分类事件时,快速确定其事件类型为新的事件类型成为了难点。


技术实现思路

1、本申请提供一种事件分类模型的训练方法、使用方法、装置及介质,用以实现在少样本场景下事件的快速、准确地分类。

2、第一方面,本申请提供一种事件分类模型的训练方法,该方法包括:

3、获取文章数据的关键句子集合,所述文章数据是通过预设方式从预设数据来源爬取的;

4、按照预设层面从所述关键句子集合中提取文章整体特征,以得到支持集;所述预设层面包括所述关键句子与文章标题的关联度,以及所述关键句子与事件描述信息的关联度,所述事件描述信息是对相应预设事件类型的描述;所述支持集包含不同所述预设事件类型的文章整体特征;

5、通过原型网络计算所述支持集中每个所述预设事件类型的样本均值,以得到原型表征,并基于所述原型表征和事件描述表征,确定类向量;所述事件描述表征是基于所述事件描述信息得到的,所述类向量是所述预设事件类型的表征;

6、根据所述支持集和所述类向量,对原始分类模型进行训练,以得到训练好的事件分类模型;其中,以在输入所述文章整体特征时,输出相应的类向量为训练目标。

7、第二方面,本申请提供一种事件分类模型的使用方法,该方法包括:

8、在获取到在线文章时,获取所述在线文章的关键句子集合,并根据所述关键句子集合提取所述在线文章的文章特征;

9、将所述文章特征输入至训练好的事件分类模型中,以得到所述在线文章的类向量,根据所述类向量确定事件类型;所述事件分类模型是基于第一方面任一项所述的事件分类模型的训练方法得到的。

10、第三方面,本申请提供一种事件分类模型的训练装置,该装置包括:

11、获取模块,用于获取文章数据的关键句子集合,所述文章数据是通过预设方式从预设数据来源爬取的;

12、第一提取模块,用于按照预设层面从所述关键句子集合中提取文章整体特征,以得到支持集;所述预设层面包括所述关键句子与文章标题的关联度,以及所述关键句子与事件描述信息的关联度,所述事件描述信息是对相应预设事件类型的描述;所述支持集包含不同所述预设事件类型的文章整体特征;

13、计算模块,用于通过原型网络计算所述支持集中每个所述预设事件类型的样本均值,以得到原型表征,并基于所述原型表征和事件描述表征,确定类向量;所述事件描述表征是基于所述事件描述信息得到的,所述类向量是所述预设事件类型的表征;

14、训练模块,用于根据所述支持集和所述类向量,对原始分类模型进行训练,以得到训练好的事件分类模型;其中,以在输入所述文章整体特征时,输出相应的类向量为训练目标。

15、第四方面,本申请提供一种事件分类模型的使用装置,该装置包括:

16、第二提取模块,用于在获取到在线文章时,获取所述在线文章的关键句子集合,并根据所述关键句子集合提取所述在线文章的文章特征;

17、分类模块,用于将所述文章特征输入至训练好的事件分类模型中,以得到所述在线文章的类向量,根据所述类向量确定事件类型;所述事件分类模型是基于第一方面任一项所述的事件分类模型的训练方法得到的。

18、第五方面,本专利技术提供一种电子设备,包括:至少一个处理器和存储器;

19、所述存储器存储计算机执行指令;

20、所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面或第二方面中任一项所述的方法。

21、第六方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面或第二方面中任一项所述的方法。

22、本申请提供一种事件分类模型的训练方法、使用方法、装置及介质,在本申请的训练方法中,电子设备首先获取文章数据的关键句子集合,然后基于关键句子与文章标题的关联度,以及关键句子与事件描述信息的关联度,从关键句子集合中提取文章整体特征,并得到包含不同预设事件类型的文章整体特征的支持集。进一步的,电子设备对通过原型网络得到的原型表征和预设事件类型的事件描述保证进行融合,得到预设事件类型的类向量。最后,电子设备基于支持集和类向量对原始分类模型进行训练,以得到训练好的事件分类模型。基于此训练过程的事件分类模型,在少样本场景时,也能够快速、准确地对事件进行分类。

本文档来自技高网...

【技术保护点】

1.一种事件分类模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取文章数据的关键句子集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述第一相似度矩阵、所述第二相似度矩阵及所述第三相似度矩阵,确定所述关键句子集合,包括:

4.根据权利要求3所述的方法,其特征在于,所述按照预设层面从所述关键句子集合中提取文章整体特征,以得到支持集,包括:

5.根据权利要求3所述的方法,其特征在于,所述基于所述原型表征和事件描述表征,确定类向量,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述支持集和所述类向量,对原始分类模型进行训练之前,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述根据所述支持集和所述类向量,对原始分类模型进行训练,包括:

8.一种事件分类模型的使用方法,其特征在于,所述方法包括:

9.一种事件分类模型的训练装置,其特征在于,包括:

10.一种事件分类模型的使用装置,其特征在于,包括

11.一种电子设备,其特征在于,包括:至少一个处理器和存储器;

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-8任一项所述的方法。

...

【技术特征摘要】

1.一种事件分类模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取文章数据的关键句子集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述第一相似度矩阵、所述第二相似度矩阵及所述第三相似度矩阵,确定所述关键句子集合,包括:

4.根据权利要求3所述的方法,其特征在于,所述按照预设层面从所述关键句子集合中提取文章整体特征,以得到支持集,包括:

5.根据权利要求3所述的方法,其特征在于,所述基于所述原型表征和事件描述表征,确定类向量,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述支持集和所述...

【专利技术属性】
技术研发人员:毕经纶刘继超陈斌王玮金岩甘琳
申请(专利权)人:海纳云物联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1