【技术实现步骤摘要】
本公开涉及人工智能领域,更具体地,涉及事件抽取方法、模态对齐训练方法、装置、设备、介质和程序产品。
技术介绍
1、在金融风控、舆论监控、知识图谱等领域,存在大量的信息,将其中非结构化信息转化为结构化信息可以称之为事件抽取。由于信息的多样性,可能存在多模态的信息。模态是指信息的组织形式或来源,常见模态包括视觉、听觉、文本等。不同的模态信息具有不同的组织形式或来源。
2、在实现本公开专利技术构思的过程中,专利技术人发现,现有的多模态事件抽取任务交由单个模型执行,而为了平衡各个模态的数据处理效果,对于某个模态的数据处理能力难以与专门处理该模态数据的模型媲美。而若各个模态分别交由专门模型处理,各个模型的输出处于不同的向量空间,不利于各模态的向量表示之间的交互,无法取得理想的事件抽取效果。例如获得的文本向量表征处于文本向量空间,该文本向量与图片向量表示处于不同的向量空间,不利于文本向量表示与图片向量表示的交互。
技术实现思路
1、鉴于上述问题,本公开提供了事件抽取方法、模态对齐训练方法、
...【技术保护点】
1.一种事件抽取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1或2所述的方法,其特征在于,预先对所述N个编码模型进行模态对齐训练包括:
4.根据权利要求3所述的方法,其特征在于,在计算对应相同模态的编码输出与基准编码数据之间的对齐损失之前,所述方法还包括:
5.根据权利要求3所述的方法,其特征在于,
6.根据权利要求5所述的方法,其特征在于,所述N个样本数据标注有事件标签,预先对所述N个编码模型进行模态对齐训练还包括:
7.根据权利要求6所述的方法,其特征
...【技术特征摘要】
1.一种事件抽取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1或2所述的方法,其特征在于,预先对所述n个编码模型进行模态对齐训练包括:
4.根据权利要求3所述的方法,其特征在于,在计算对应相同模态的编码输出与基准编码数据之间的对齐损失之前,所述方法还包括:
5.根据权利要求3所述的方法,其特征在于,
6.根据权利要求5所述的方法,其特征在于,所述n个样本数据标注有事件标签,预先对所述n个编码模型进行模态对齐训练还包括:
7.根据权利要求6所述的方法,其特征在于,预先对所述n个编码模型进行模态对...
【专利技术属性】
技术研发人员:陆鹏程,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。