基于机器学习的3D图像识别方法及其系统技术方案

技术编号:17110829 阅读:94 留言:0更新日期:2018-01-24 22:43
本发明专利技术涉及基于机器学习的3D图像识别方法及其系统,该方法包括获取图像,并对图像进行分割,获取两张子图像;获取其中一张子图像内若干个待识别区域;获取另一张子图像内与若干个待识别区域位置对应的目标区域;获取待识别区域与目标区域的相似度;结合机器学习获取最佳阈值;判断相似度是否大于最佳阈值;若是,则为3D图像;若不是,则为2D图像。本发明专利技术通过对图像进行分割,利用分割后的子图像进行相似度获取,通过相似度与最佳阈值的对比,进行3D图像以及2D图像的识别,通过机器学习的方式对大量样本进行训练提高算法的识别准确率,样本愈大准确率愈高,实现自动识别2D以及3D图像和视频,兼容性强,且识别准确度高。

3D image recognition method and its system based on machine learning

The invention relates to a 3D image recognition method based on machine learning and system, the method includes image acquisition and image segmentation, obtain two sub image; obtaining one sub image in a number of areas to be identified; for another Zhang Zi image and several unknown areas don't corresponding to the position of the target area; get the similarity to identify areas and target areas; learning to obtain the best threshold with the machine; judge the similarity is greater than the threshold; if yes, for the 3D image; if not, for 2D images. Through the method of image segmentation, the similarity is obtained by using the segmented image, by comparing the similarity with the optimal threshold, 3D image and 2D image recognition through machine learning to improve the accuracy of the recognition algorithm for training a large number of samples, sample more accurate rate is high, realize the automatic recognition of 2D 3D, image and video, compatibility, and high recognition accuracy.

【技术实现步骤摘要】
基于机器学习的3D图像识别方法及其系统
本专利技术涉及图像和视频处理方法,更具体地说是指基于机器学习的3D图像识别方法及其系统。
技术介绍
目前识别3D图像或者视频的方式除了传统的图像识别算法,还有裸眼3D,其中,传统的图像识别算法如下:将目标图片进行特征提取,描述图像的算法很多,用的比较多的是:SIFT描述子,指纹算法函数,bundlingfeatures算法,hash、散列函数等;将图像特征信息进行编码;利用目标图像的编码值,在图像数据库进行全局或是局部的相似度计算;将相似度高的图片预保留下来,按一定规则筛选出最佳匹配图片。而裸眼3D是一种把普通3D视频或图像经过特定算法处理后通过硬件分别渲染到人的左右眼的技术,目前仅有个别公司开发了支持此技术的媒体播放器和图像浏览器,为了兼容传统的渲染模式,现有支持裸眼3D功能的播放器和图像浏览器多是增加一个功能开关,或者在源文件里添加一个自定义的标志符。但是,上述的识别3D图像或者视频的方法,通过添加功能开关的方式需用户自行识别手动选择合适的渲染模式,使用不便影响用户体验;通过添加自定义标志符的方式无法识别第三方的数据源,且自定义的标志符不能本文档来自技高网...
基于机器学习的3D图像识别方法及其系统

【技术保护点】
基于机器学习的3D图像识别方法,其特征在于,所述方法包括:获取图像,并对图像进行分割,获取两张子图像;获取其中一张子图像内若干个区域,形成待识别区域;获取另一张子图像内与若干个待识别区域位置对应的区域,形成目标区域;获取待识别区域与目标区域的相似度;结合机器学习获取最佳阈值;判断所述相似度是否大于最佳阈值;若是,则所述图像为3D图像;若不是,则所述图像为2D图像。

【技术特征摘要】
1.基于机器学习的3D图像识别方法,其特征在于,所述方法包括:获取图像,并对图像进行分割,获取两张子图像;获取其中一张子图像内若干个区域,形成待识别区域;获取另一张子图像内与若干个待识别区域位置对应的区域,形成目标区域;获取待识别区域与目标区域的相似度;结合机器学习获取最佳阈值;判断所述相似度是否大于最佳阈值;若是,则所述图像为3D图像;若不是,则所述图像为2D图像。2.根据权利要求1所述的基于机器学习的3D图像识别方法,其特征在于,获取图像,并对图像进行分割,获取两张子图像的步骤,包括以下具体步骤:以BMP格式载入图像;将图像缩小至指定大小;对所述图像进行分割,获取两张子图像。3.根据权利要求1或2所述的基于机器学习的3D图像识别方法,其特征在于,获取待识别区域与目标区域的相似度的步骤,包括以下具体步骤:获取待识别区域内每个待识别点的颜色以及亮度;获取目标区域内与待识别点对应的目标点的颜色以及亮度;判断待识别点与对应目标点的颜色或亮度是否接近;若是,则将结果记为真,若否,则将结果记为假;判断所有待识别区域内的待识别点的颜色或亮度是否判断完毕;若是,则统计结果为真以及结果为假的比例,形成相似度;若否,则返回所述判断待识别点与对应目标点的颜色或亮度是否接近步骤。4.根据权利要求3所述的基于机器学习的3D图像识别方法,其特征在于,结合机器学习获取最佳阈值的步骤,包括以下具体步骤:获取2D样本空间和3D样本空间;设定阈值的预设经验范围;记录各种阈值组合下的识别率、误识率及识别时间;根据别率、误识率及识别时间,采用边缘和中值逼近的机器学习方式获取3D识别率最高、2D误识率最低且识别时间最短的阈值,形成最佳阈值。5.基于机器学习的3D图像识别系统,其特征在于,包括图像处理单元、待识别区域获取单元、目标区域获取单元、相似度获取单元、最佳阈值获取单元以及判断单元;所述图像处理单元,用于获取图像,并对图像进行分割,获取两张子图像;所述待识别区域获取单元,用于获...

【专利技术属性】
技术研发人员:张东坡尹红宽蔡阿成
申请(专利权)人:深圳市得色科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1