开放域社会事件分类方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37794301 阅读:24 留言:0更新日期:2023-06-09 09:24
本发明专利技术提供一种开放域社会事件分类方法、装置、电子设备和存储介质,涉及人工智能技术领域,所述方法包括:获取社会事件目标数据;将社会事件目标数据输入开放域社会事件分类模型,输出社会事件目标数据对应的分类类别;其中,分类类别是基于社会事件目标数据的至少两个模态特征融合得到的多模态融合特征确定的,多模态融合特征用于表征各模态特征之间的跨模态语义关系,开放域社会事件分类模型的开放域分类损失函数是基于混合分类损失函数、未知类焦点损失函数和不确定性损失函数确定的。本发明专利技术可基于跨模态语义关系,实现包括已知类和未知类的开放域社会事件分类。未知类的开放域社会事件分类。未知类的开放域社会事件分类。

【技术实现步骤摘要】
开放域社会事件分类方法、装置、电子设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种开放域社会事件分类方法、装置、电子设备和存储介质。

技术介绍

[0002]随着互联网和多媒体的快速发展,人们可以通过各种社交媒体平台在线接收和发送社交媒体消息。同时,社交媒体上的热门事件可以通过转发和评论等用户交互迅速传播到世界各地。大量具有如图像、视频和文本等多种模态的社交媒体事件在互联网上传播,这意味着从海量社交媒体数据中自动挖掘和总结社会事件热点话题的重要性。如何对社会事件进行挖掘和分类也是信息推荐、搜索引擎和其他一些智能系统的核心问题之一。因此,对社会事件分类的研究具有重要意义。
[0003]现有技术中,社会事件分类方法主要依赖于一个封闭世界的假设,即测试出的类别必须出现在训练过程中。社会事件分类方法一般包括:(1)传统手工方法,通过手工特征提取对社会事件进行分类,然而,手工特征提取中人类主观性较强,且无法获取深层语义特征,导致分类准确度较低;(2)深度神经网络方法,通过简单地将不同模态特征连接起来形成多模态事件特征,进而进本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种开放域社会事件分类方法,其特征在于,包括:获取社会事件目标数据;将所述社会事件目标数据输入开放域社会事件分类模型,输出所述社会事件目标数据对应的分类类别;其中,所述分类类别是基于所述社会事件目标数据的至少两个模态特征融合得到的多模态融合特征确定的,所述多模态融合特征用于表征各所述模态特征之间的跨模态语义关系,所述开放域社会事件分类模型的开放域分类损失函数是基于混合分类损失函数、未知类焦点损失函数和不确定性损失函数确定的。2.根据权利要求1所述的开放域社会事件分类方法,其特征在于,所述开放域社会事件分类模型是基于以下步骤训练得到的:构建社会事件训练数据集,所述社会事件训练数据集中每个社会事件训练数据均包括至少两个相匹配的社会事件模态数据和所述社会事件训练数据对应的模态标签,所述社会事件训练数据集包括已知类训练数据和未知类训练数据;针对每个所述社会事件训练数据,确定各所述社会事件模态数据对应的模态特征;将各所述模态特征输入多模态掩码网络,确定各所述模态特征融合后的多模态融合特征;基于各所述社会事件训练数据、各所述社会事件训练数据对应的标签和所述多模态融合特征,对初始开放域社会事件分类模型进行监督训练,得到所述开放域社会事件分类模型。3.根据权利要求2所述的开放域社会事件分类方法,其特征在于,所述未知类训练数据是基于以下步骤得到的:基于所述已知类训练数据,确定混合样本池;从所述混合样本池中,不放回地随机获取任意两个所述已知类训练数据;将所述任意两个所述已知类训练数据对应的各所述社会事件模态数据进行互换,确定未知类训练数据。4.根据权利要求2或3所述的开放域社会事件分类方法,其特征在于,所述确定各所述模态特征融合后的多模态融合特征,包括:针对每个所述模态特征,确定以所述模态特征作为查询的模态融合特征;将各所述模态融合特征进行融合,得到所述多模态融合特征。5.根据权利要求4所述的开放域社会事件分类方法,其特征在于,所述确定以所述模态特征作为查询的模态融合特征,包括:针对每个所述模态特征,基于多头注意力机制,确定所述模态特征对应的键...

【专利技术属性】
技术研发人员:钱胜胜徐常胜薛迪展
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1