一种在纠缠场景表示中发现物体及其关系的方法技术

技术编号：15864462 阅读：112 留言：0更新日期：2017-07-23 09:42

本发明专利技术中提出的一种在纠缠场景表示中发现物体及其关系的方法，其主要内容包括：关系网络模型、多层网络感知器、自定义数据集、容量增益关系网络，其过程为，首先定量描述物体及其特征属性，将其信息平行地输入到两个卷积神经网络，然后将其输出经过批量正态分布层和线性函数层，再缩减一半的维度输入到容量增益网络得到读写操作，然后计算各外部记忆槽中向量的余弦距离，来衡量物体相互之间的关系。本发明专利技术可以提取图像更深层的表示形式，通过差分编码器的编码与解码，将信息的属性描述得更加全面，从而可以得到物体之间更清晰的对比关系。

全部详细技术资料下载

【技术实现步骤摘要】
一种在纠缠场景表示中发现物体及其关系的方法
本专利技术涉及图像内容识别领域，尤其是涉及了一种在纠缠场景表示中发现物体及其关系的方法。
技术介绍
在二维图像中，记录了静态物体相互之间的关系，如厨房的照片会有菜刀，床上的照片会有枕头等，这些信息极大地帮助人工智能自主认识并学习到人类时间某些物体之间具有较强的联系，同时在日益增多的媒体介质中，人力劳动并不能完全识别所有图像，因此，教会人工智能如何联系图像内容分析纠缠场景中物体相互关系，显得非常重要。在社会应用和经济效益方面同样具有重大的潜力，如交通事故中伤者与车辆的数量关系、人群高聚集地的逃生路线、乃至日常购物的时尚搭配、家居装潢等都有实用的场景。但如何让人工智能学会自主识别内容，仍然是一个很有挑战性的问题。由于二维图像的清晰度、像素的相互关系、及场景的单一化都有可能导致机器学习无法进入收敛，同时现实中不存在相应的数量较大的数据库进行训练，需要自行添加相关要素或标签。此外，自主识别的内容无法让人工智能理解其含义或者地位，从而即便得到消息不能直接使用其信息获取下一步的指示，仍然需要人力进行监督。本专利技术提出了一种基于容量增益关系网络的新框架。使用固定描述接口语言定量描述物体及其特征属性，将其信息平行地输入到两个卷积神经网络并将其输出经过批量正态分布层和线性函数层，再缩减一半的维度输入到容量增益网络得到读写操作，然后计算各外部记忆槽中向量的余弦距离，来衡量物体相互之间的关系。本专利技术可以提取图像更深层的表示形式，通过差分编码器的编码与解码，将信息的属性描述得更加全面，从而可以得到物体之间更清晰的对比关系。专利技术...
一种在纠缠场景表示中发现物体及其关系的方法

【技术保护点】
一种在纠缠场景表示中发现物体及其关系的方法，主要包括关系网络模型(一)；多层网络感知器(二)；自定义数据集(三)；容量增益关系网络(四)。

【技术特征摘要】
1.一种在纠缠场景表示中发现物体及其关系的方法，主要包括关系网络模型(一)；多层网络感知器(二)；自定义数据集(三)；容量增益关系网络(四)。2.基于权利要求书1所述的关系网络模型(一)，其特征在于，包括场景定量描述和模型实施。3.基于权利要求书2所述的场景定量描述，其特征在于，假设在纠缠场景中存在一个物体i，该物体具有n种特征属性，例如物体类型、颜色、尺寸、位置等信息，则其可以被表示为：其中，若总共具有m个物体，则可用m×n维矩阵D表示；据公式(1)，场景是完全抽象的，场景由堆砌的物体所定义，物体由组成的特征属性所定义。4.基于权利要求书2所述的模型实施，其特征在于，该模型自身关系的发掘基于先验知识的特定因式分解，有：其中，gψ是带有参数的因式分解函数，此时，有：其中，f为返回预测关系的函数。5.基于权利要求书1所述的多层网络感知器，其特征在于，根据公式(2)(3)直接作用于特征属性，多层网络感知器直接作用于物体本身，即：其中，进一步地，在一组相互有交集联系的物体中，其关系必然会存在于场景内容中，因此需要在交叉属性中进行计算以遍历这些交集：即函数g可能作用于成对的物体上。6.基于权利要求书1所述的自定义数据集，其特征在于，对于具有位置关系的场景，根节点坐标首先被在一个有界空间中被随机选出；接着，子目标被随机安排到特定的父目标，具体位置可由父坐标来得到：其中，θp是父目标计算角度；对于根节点d＝d0+d1是计算得到的长度，d0是最短距离，d1是从半正态分布中得到的采样距离，最终，场景定量描述可由16行矩阵组成来描述位置、颜色、尺寸和形状四种类型，每种类型占用4行。7.基于权利要求书1所述的容量增益关系网络，其特征在...

【专利技术属性】
技术研发人员：夏春秋，
申请(专利权)人：深圳市唯特视科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人