一种基于多模态事件本体的图像事件识别方法技术

技术编号：34738522 阅读：13 留言：0更新日期：2022-08-31 18:29

本发明专利技术公开了一种基于多模态事件本体的图像事件识别方法，包含以下步骤：图像关键词获取：使用多标签分类技术，获取输入图像信息中的重要关键词；筛选事件类集合：利用获取到的关键词，通过与事件类六元组表示结构中的要素信息进行文本匹配，在多模态事件本体模型中寻找匹配度最高的事件类集合；图像匹配：对所述筛选过的高匹配度的事件类集合中所有事件类的图像，将其与输入图像进行基于特征的匹配，选择得分最高的对应事件类，即为最终图像事件识别的结果。本发明专利技术可以使图像事件识别过程趋于结构化和标准化，从而提高事件识别的准确度。确度。确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态事件本体的图像事件识别方法

[0001]本专利技术涉及图像识别
，尤其涉及一种基于多模态事件本体的图像事件识别方法。

技术介绍

[0002]图像是人类理解世界的一个重要辅助工具。随着人工智能技术的快速发展，机器对图像的处理也不再仅局限于简单的分类任务，而是逐步聚焦于对图像信息的深层理解与应用。
[0003]事件是指在特定时间和环境下发生的、由若干角色参与的、表现出特定动作或状态变化的过程。将事件以“对象”、“动作”、“时间”、“环境”、“状态”、“语言表现”的六元组形式表示，可以得到事件的规范化描述。
[0004]图像事件识别主要是通过图像处理技术识别图像中所发生的事件，其目标是尽可能细致地描述该事件中的参与者(人或物)、环境信息以及事件类别等，这包括基于视觉的直观判断和基于常识的辅助推理过程。因此，在识别过程中，除了聚焦于图像的视觉特征之外，还应注重对其语义信息的理解。可以说，图像的目标分类和识别等技术都为语义理解服务。
[0005]事件类指由类型相同或相似的事件所构成的集合，是对多个事件的抽象总结。事件本体是指针对通用或特定领域的应用场景，将多种相关事件类进行筛选组合，并结合事件类关系以及一定的推理规则，所得到的一种可以覆盖所有场景的知识库。事件本体可以将海量的非结构化文本事件整合成一种趋于结构化的形式，使事件的表示形式更加清晰。
[0006]目前研究界开始考虑将多模态信息应用于图像的深度理解过程中。多模态技术是将文本、图像和语音等各种类型的信息结合起来的技术，...

【技术保护点】

【技术特征摘要】
1.一种基于多模态事件本体的图像事件识别方法，其特征在于，包含以下步骤：图像关键词获取：使用多标签分类技术，获取输入图像的重要关键词；筛选事件类集合：利用获取到的关键词，通过与事件类六元组表示结构中的要素信息进行文本匹配，在事件本体模型中寻找匹配度最高的事件类集合；图像匹配：对所述筛选过的高匹配度的事件类集合中所有事件类的图像，将其与输入图像进行基于特征的匹配，选择得分最高的对应事件类，即为最终图像事件识别的结果。2.如权利要求1所述的一种基于多模态事件本体的图像事件识别方法，其特征在于，图像关键词获取步骤还包括以下部分：图像区域提取：提取图像的重点区域，获得包含图像重点部分的若干子图，这些子图代表图像的主要信息；多标签分类器：基于多标签分类技术，将所述区域提取技术中产生的子图分别进行处理，得到各区域子图对应的关键词集合；关键词标注：对所述区域子图的关键词集合进行词性标注，并根据词性对关键词集合做新的划分。3.如权利要求2所述的方法，其特征在于，在所述区域提取部分，采用Selective Search或者RPN技术获取图像的代表区域，并且使每个代表区域子图尽量只保留一项重点目标。4.如权利要求2所述的方法，其特征在于，在多标签分类部分，让所述代表区域子图经过多标签分类CNN模型，...

【专利技术属性】
技术研发人员：刘炜，何晴，彭艳，谢少荣，方世忠，褚晓波，李晶，翟杨，赵荦，杨天源，
申请(专利权)人：上海市文化和旅游局上海市广播电视局，上海市文物局上海市文物保护研究中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人