一种基于能量模型的图像语义标注方法技术

技术编号：20918387 阅读：39 留言：0更新日期：2019-04-20 10:04

本发明专利技术属于计算机应用技术领域，公开了一种基于能量模型的图像语义标注方法，包括：使用马尔科夫随机场方法分割图像，得到两组图像数据；将图像数据送入图像识别层进行初步识别；将初步识别的结果送入信息提取层进行特征信息提取并进行编码；将编码送入归纳层进行能量模型建立；建立能量模型，将两组编码进行比较分析、运算，直到能量最小；输出图片标注信息结果。本发明专利技术分离了开发人员的关注，提高了系统可维护性、避免了人工分割图像、对称分割图像的语义单一问题，将图像的语义理解分为信息提取和归纳，较好地解决了“语义鸿沟”问题。

An Image Semantic Annotation Method Based on Energy Model

The invention belongs to the field of computer application technology, and discloses an image semantic annotation method based on energy model, which includes: using Markov random field method to segment images and obtain two sets of image data; sending image data to the image recognition layer for preliminary recognition; sending the preliminary recognition results to the information extraction layer for feature information extraction and coding; and transmitting the coding. In the induction layer, the energy model is established; the energy model is established, and the two codes are compared and calculated until the energy is minimum; the result of image annotation information is output. The invention separates the attention of developers, improves the maintainability of the system, avoids the single problem of semantics of artificially segmented images and symmetrically segmented images, and divides the semantic understanding of images into information extraction and induction, thus solving the problem of \semantic gap\ better.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于能量模型的图像语义标注方法
本专利技术属于计算机应用
，尤其涉及一种基于能量模型的图像语义标注方法。
技术介绍
目前，业内常用的现有技术是这样的：随着数字影像技术与互联网技术迅速发展，互联网上有着数以百亿计的图像，进行图像的语义标记是搜索引擎快速检索、图像分类识别与存储的关键技术。目前，商业化图像搜索引擎都是以文本关键字的形式来查询，其关键字主要依靠人工标注及Web文本，工作量巨大且缺乏一定的客观性。此外，人工和Web文本因为“语义鸿沟”的原因，都不能很好匹配用户的检索意图。基于以上应用缺陷，图像自动标注可以改善目前的检索困境。能量模型(EnergybasedModel，EBM)是一种具有普适意义的模型，可以说它是一种模型框架，在它的框架下囊括传统的判别模型和生成模型，图变换网络，条件随机场，最大化边界马尔科夫网络以及一些流形学习的方法等。EBM通过对变量的每个配置施加一个有范围限制的能量来捕获变量之间的依赖关系。EBM有两个主要的任务，一个是推断(Inference)，它主要是在给定观察变量的情况，找到使能量值最小的那些隐变量的配置；另一个是学习(Learning)，它主要是寻找一个恰当的能量函数，使样本中正确的输入输出的能量比错误的输入输出的能量低。基于能量的模型(EBM)把我们所关心变量的各种组合和一个标量能量联系在一起。玻尔兹曼机(BoltzmannMachine，BM)是一种特殊形式的对数线性的马尔科夫随机场(MarkovRandomField，MRF)，即能量函数是自由变量的线性函数。通过引入隐含单元，我们可以提升模型的表达能力，...

【技术保护点】
1.一种基于能量模型的图像语义标注方法，其特征在于，所述基于能量模型的图像语义标注方法包括：第一步，使用马尔科夫随机场方法分割图像，得到两组图像数据；将图像数据送入图像识别层进行初步识别；第二步，将初步识别的结果送入信息提取层进行特征信息提取并进行编码；将编码送入归纳层进行能量模型建立；第三步，建立能量模型，将两组编码进行比较分析、运算，直到能量最小；输出图片标注信息结果。

【技术特征摘要】
1.一种基于能量模型的图像语义标注方法，其特征在于，所述基于能量模型的图像语义标注方法包括：第一步，使用马尔科夫随机场方法分割图像，得到两组图像数据；将图像数据送入图像识别层进行初步识别；第二步，将初步识别的结果送入信息提取层进行特征信息提取并进行编码；将编码送入归纳层进行能量模型建立；第三步，建立能量模型，将两组编码进行比较分析、运算，直到能量最小；输出图片标注信息结果。2.如权利要求1所述的基于能量模型的图像语义标注方法，其特征在于，所述马尔科夫随机场方法分割为：二维图片几何中心为初始状态，向四周随机找下一个分割点，下一个分割点位置只与前一分割点有关，依次类推，直到最后一个分割点与之前任意分割节点重合，完成一次分割。3.如权利要求1所述的基于能量模型的图像语义标注方法，其特征在于，能量模型中最大化的边界马尔科夫网络，对分割点的每个配置施加一个有范围限制的能量捕获分割点之间的依赖关系。4.如权利要求1所述的基于能量模型的图像语义标注方法，其特征在于，所述第一步具体包括：将MRF图像分割方法应用于图像处理领域，图像分割的建模过程包括：平面上的点集记为S，S＝{s1...

【专利技术属性】
技术研发人员：田东平，
申请(专利权)人：宝鸡文理学院，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人