一种基于语义特征提取与匹配的物体识别方法技术

技术编号:10353840 阅读:104 留言:0更新日期:2014-08-27 10:18
本发明专利技术提供了一种基于语义特征提取与匹配的物体识别方法,属于信息检索领域。本发明专利技术包括语义特征提取和语义特征匹配两部分,语义特征提取部分首先提取一类物体训练图片的SIFT特征点,通过k-均值聚类对SIFT特征点进行空间聚类,然后利用基于核函数的决策机制,决策出每个空间类别内的若干有效点,最后利用支持向量机分类器训练每个空间类别内的有效点,每个空间类别训练出一个具有语义特征的视觉单词,便最终提取出可描述一类物体语义特征的视觉词汇表;语义特征匹配部分首先提取一幅待测物体图片的SIFT特征点,作为待测物体的语义描述,然后利用支持向量机分类器,将待测物体的语义描述与多类物体的视觉词汇表匹配分类,最后统计待测物体的视觉词汇表直方图,确定待测物体类别。

【技术实现步骤摘要】

本专利技术属于信息检索领域,具体涉及。
技术介绍
物体识别的本质就是建立一个能够识别出图像中感兴趣物体类别的计算系统,在现实生活中有着广泛的应用需求,具有相当高的应用价值和研究意义。近年来,随着模式分类技术的不断成熟以及人工智能的持续发展,基于语义特征提取的物体识别技术逐渐被广大学者所青睐。物体的语义特征就是通过提取一类物体的局部特征,然后按照一定的处理准则将局部特征转化为描述一类物体的语义信息,形成一类物体的语义特征模型,实现可行有效的物体分类识别效果。在目前的物体识别领域,Bag of Words算法是最具有代表性的物体识别算法之一。算法认为一幅图像由若干个具有语义信息的视觉单词组成。提取图片中的若干局部特征并将其转化为视觉单词,根据视觉单词与视觉词汇表的关系生成一幅图片的视觉单词直方图,视觉单词直方图表述一幅图片的特征,可以有效的实现物体的识别分类。Bag of Words算法中视觉词汇表是将局部描述符进行k_均值聚类之后的聚类中心表示的。将一类物体所有图片的特征点聚类,聚类的个数就是视觉单词词汇表的词汇量,词汇表的视觉单词就是每类的聚类中心。但是,仅仅利用聚类中心单个特征点作为一类特征点的描述,没有充分利用局部特征,也没有充分利用经过聚类之后产生的语义信息。单个聚类中心丧失了大量语义信息,不适合作为一个有效的视觉单词。
技术实现思路
本专利技术的目的在于解决上述现有技术中存在的难题,提供了一种基于核函数决策的语义特征提取方法,在语义特征提取阶段,通过核函数决策,选取每个空间类别内的若干有效点作为视觉单词,提取出类别稳定且信息丰富语义特征信息。本专利技术是通过以下技术方案实现的: 一种在物体识别过程中对物体语义特征提取与匹配的方法,其特征在于,所述方法包括: (I)语义特征提取部分:首先选取一类物体的若干图片作为训练库,提取所有图片的SIFT特征点;通过k-均值聚类算法对所有SIFT特征点进行空间聚类,然后利用基于核函数的决策机制,决策出每个空间类别内的若干有效点;利用支持向量机分类器训练每个空间类别内的有效点,每个空间类别训练出一个具有语义特征的视觉单词,便最终提取出可描述一类物体语义特征的视觉词汇表;选取多类物体的训练图片,提取每类物体的视觉词汇表,形成多类物体的视觉词汇表。(2)语义特征匹配部分:首先提取一幅待测物体图片的SIFT特征点,作为待测物体的语义描述;利用支持向量机分类器,将待测物体的语义描述与多类物体的视觉词汇表匹配分类;统计待测物体的视觉词汇表直方图,确定待测物体类别。其中,所述语义特征提取部分包括以下步骤: (1)选取一类物体的F幅训练图片,提取每幅图片的SIFT特征点; (2)将该类物体的所有的特征点X聚类为个空间类别,提取各空间类别的聚类中心 (3)按照基于核函数的决策机制,对尤类中的每个特征点进行决策,得到每个特征点的决策值/(64 ; (4)设置支持向量机类别训练数据标识。选取单个空间类别内的若干有效特征点为本类别训练点;选取所有其它空间类别的若干有效点作为其它类别的特征训练点; (5)针对于(4)标识的训练数据,利用SVM分类器学习训练,训练得到一类物体的^个视觉单词,即该类物体的视觉词汇表; (6)选取多类物体的训练图片,提取每个类别的视觉词汇表,形成多类物体的视觉词汇表。所述步骤(3)的计算公式如下:本文档来自技高网...

【技术保护点】
一种基于语义特征提取与匹配的物体识别方法,其特征在于,所述方法包括:(1)语义特征提取部分:首先选取一类物体的若干图片作为训练库,提取所有图片的SIFT特征点;通过k‑均值聚类算法对所有SIFT特征点进行空间聚类,然后利用基于核函数的决策机制,决策出每个空间类别内的若干有效点;利用支持向量机分类器训练每个空间类别内的有效点,每个空间类别训练出一个具有语义特征的视觉单词,最终提取出可描述一类物体语义特征的视觉词汇表;选取多类物体的训练图片,提取每类物体的视觉词汇表,形成多类物体的视觉词汇表;(2)语义特征匹配部分:首先提取一幅待测物体图片的SIFT特征点,作为待测物体的语义描述;利用支持向量机分类器,将待测物体的语义描述与多类物体的视觉词汇表匹配分类;统计待测物体的视觉词汇表直方图,确定待测物体类别。

【技术特征摘要】
1.一种基于语义特征提取与匹配的物体识别方法,其特征在于,所述方法包括: (1)语义特征提取部分:首先选取一类物体的若干图片作为训练库,提取所有图片的SIFT特征点;通过k-均值聚类算法对所有SIFT特征点进行空间聚类,然后利用基于核函数的决策机制,决策出每个空间类别内的若干有效点;利用支持向量机分类器训练每个空间类别内的有效点,每个空间类别训练出一个具有语义特征的视觉单词,最终提取出可描述一类物体语义特征的视觉词汇表;选取多类物体的训练图片,提取每类物体的视觉词汇表,形成多类物体的视觉词汇表; (2)语义特征匹配部分:首先提取一幅待测物体图片的SIFT特征点,作为待测物体的语义描述;利用支持向量机分类器,将待测物体的语义描述与多类物体的视觉词汇表匹配分类;统计待测物体的视觉词汇表直方图,确定待测物体类别。2.根据权利要求1所述的方法,其特征在于,所述语义特征提取部分包括以下:(1)选取一类物体的幅训练图片,提取每幅图片的SIFT特征点; (2)将该类物体的所有的特征点Z聚类为K个空间类别,提取各空间类别的聚类中心 (3)按照基于核函数的决策机制,对类中的每个特征点进行决策,得到每个特征点的决策值/(^ ; (4)设置支持向量机类别训练数据标识Y,选取单个空间类别内的若干有效特征点...

【专利技术属性】
技术研发人员:艾浩军艾雄军艾晓敏
申请(专利权)人:武汉三际物联网络科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1