事件抽取方法、模态对齐训练方法、装置、设备和介质制造方法及图纸

技术编号：42465231 阅读：16 留言：0更新日期：2024-08-21 12:52

提供了一种事件抽取方法，涉及人工智能领域。该方法包括：获取N个待处理数据，其中任两个待处理数据具有不同模态；将所述N个待处理数据一一对应的经由N个编码模型处理，得到模态对齐的N个编码数据，所述N个编码模型各自处理不同模态的输入且预先经由模态对齐训练得到；以及基于所述N个编码数据得到分类器的输入，获得所述分类器输出的事件抽取结果；其中，所述模态对齐训练用于使所述N个编码模型的N个编码输出与N个基准编码数据之间的对齐损失函数值小于或等于预设的第一阈值，所述N个基准编码数据之间模态对齐。能够让不同模态的数据比如图片向量和文本向量处于同一向量空间，解决多模态对齐，提升多模态数据的交互效果。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能领域，更具体地，涉及事件抽取方法、模态对齐训练方法、装置、设备、介质和程序产品。

技术介绍

1、在金融风控、舆论监控、知识图谱等领域，存在大量的信息，将其中非结构化信息转化为结构化信息可以称之为事件抽取。由于信息的多样性，可能存在多模态的信息。模态是指信息的组织形式或来源，常见模态包括视觉、听觉、文本等。不同的模态信息具有不同的组织形式或来源。

2、在实现本公开专利技术构思的过程中，专利技术人发现，现有的多模态事件抽取任务交由单个模型执行，而为了平衡各个模态的数据处理效果，对于某个模态的数据处理能力难以与专门处理该模态数据的模型媲美。而若各个模态分别交由专门模型处理，各个模型的输出处于不同的向量空间，不利于各模态的向量表示之间的交互，无法取得理想的事件抽取效果。例如获得的文本向量表征处于文本向量空间，该文本向量与图片向量表示处于不同的向量空间，不利于文本向量表示与图片向量表示的交互。

技术实现思路

1、鉴于上述问题，本公开提供了事件抽取方法、模态对齐训练方法、...

【技术保护点】

1.一种事件抽取方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1或2所述的方法，其特征在于，预先对所述N个编码模型进行模态对齐训练包括：

4.根据权利要求3所述的方法，其特征在于，在计算对应相同模态的编码输出与基准编码数据之间的对齐损失之前，所述方法还包括：

5.根据权利要求3所述的方法，其特征在于，

6.根据权利要求5所述的方法，其特征在于，所述N个样本数据标注有事件标签，预先对所述N个编码模型进行模态对齐训练还包括：

7.根据权利要求6所述的方法，其特征在于，预先对所述N个...

【技术特征摘要】

1.一种事件抽取方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1或2所述的方法，其特征在于，预先对所述n个编码模型进行模态对齐训练包括：

4.根据权利要求3所述的方法，其特征在于，在计算对应相同模态的编码输出与基准编码数据之间的对齐损失之前，所述方法还包括：

5.根据权利要求3所述的方法，其特征在于，

6.根据权利要求5所述的方法，其特征在于，所述n个样本数据标注有事件标签，预先对所述n个编码模型进行模态对齐训练还包括：

7.根据权利要求6所述的方法，其特征在于，预先对所述n个编码模型进行模态对...

【专利技术属性】
技术研发人员：陆鹏程，
申请(专利权)人：中国工商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人