【技术实现步骤摘要】
产生一物件侦测模型的计算装置及方法及物件侦测装置
本专利技术是关于一种产生一物件侦测模型的计算装置及方法以及一物件侦测装置。更具体而言,本专利技术的实施例是关于一种以一训练影像的区块性的信心分数训练一深度学习模型,以产生物件侦测模型的计算装置及方法,以及通过该物件侦测模型侦测影像中是否存在目标物件的物件侦测装置。
技术介绍
在传统基于深度学习模型的影像物件侦测技术中,在训练其深度学习模型的阶段通常相当耗时。以著名的物件侦测技术「YouOnlyLookOnce:Unified,Real-TimeObjectDetection,JosephRedmon,SantoshDivvala,RossGirshickandAliFarhadi」为例,除了所侦测的物件大小差异较大时容易出现定位误差的缺陷外,在训练其深度学习模型的一损失函数中,排除物件类别识别的部分后仍需要针对五个参数(即,一边缘框(boundingbox)的「x轴」与「y轴」坐标、该边缘框的宽度与高度、以及该边缘框中是否存在物件的一信心分数)进行收敛才能完成该深度学习模型的 ...
【技术保护点】
1.一种计算装置,其特征在于,该计算装置用以产生一物件侦测模型,且该计算装置包含:/n一存储器,用以存储一训练影像与相应的一影像标记数据,其中该训练影像中包含一训练物件,且该影像标记数据包含该训练物件在该训练影像中的一位置信息;以及/n一处理器,与该存储器电性连接,用以:/n将该训练影像划分为多个训练区块;/n针对该多个训练区块的每一者,依据该影像标记数据以及一信心分数转换函数计算该训练物件涵盖该训练区块的一正确信心分数;以及/n通过该训练影像、该多个正确信心分数以及该影像标记数据训练一深度学习模型,以产生该物件侦测模型。/n
【技术特征摘要】
20191107 TW 1081404651.一种计算装置,其特征在于,该计算装置用以产生一物件侦测模型,且该计算装置包含:
一存储器,用以存储一训练影像与相应的一影像标记数据,其中该训练影像中包含一训练物件,且该影像标记数据包含该训练物件在该训练影像中的一位置信息;以及
一处理器,与该存储器电性连接,用以:
将该训练影像划分为多个训练区块;
针对该多个训练区块的每一者,依据该影像标记数据以及一信心分数转换函数计算该训练物件涵盖该训练区块的一正确信心分数;以及
通过该训练影像、该多个正确信心分数以及该影像标记数据训练一深度学习模型,以产生该物件侦测模型。
2.如权利要求1所述的计算装置,其特征在于,该处理器是依据一切割精细度以将该训练影像划分为该多个训练区块,且该切割精细度是由该计算装置的一使用者提供。
3.如权利要求1所述的计算装置,其特征在于,于训练该深度学习模型时,该处理器还用以:
针对各该训练区块计算一推论信心分数,其特征在于,该多个推论信心分数与该多个正确信心分数皆为介于零和一之间的实数;
计算各该推论信心分数与相应的各该正确信心分数的一误差值;
针对非为零的各该推论信心分数,通过一边缘强调函数调整相应的该误差值,其中该边缘强调函数针对愈小的该推论信心分数所对应的该误差值的调整幅度愈大;以及
依据该多个误差值调整该深度学习模型。
4.如权利要求2所述的计算装置,其特征在于,该位置信息包含在该训练影像中包围该训练物件的一矩形的一坐标信息,且该信心分数转换函数是如下所示:
其中,「Ci,j」为该多个正确信心分数;「xleft」为该矩形的一最左点与该训练影像的一左边界的一距离;「ytop」为该矩形的一最上点与该训练影像的一上边界的一距离;「xright」为该矩形的一最右点与该训练影像的一右边界的一距离;「ybottom」为该矩形的一最下点与该训练影像的一下边界的一距离;「Wunit」为该训练影像的一宽度与一切割精细度的一比值;且「Hunit」为该训练影像的一高度与该切割精细度的一比值。
5.如权利要求3所述的计算装置,其特征在于,该边缘强调函数是将各该正确信心分数的一倒数开根号。
6.一种产生一物件侦测模型的方法,其特征在于包含:
一计算装置将一训练影像划分为多个训练区块,其中该训练影像中包含一训练物件;
该计算装置针对该多个训练区块的每一者,依据一影像标记数据以及一信心分数转换函数计算该训练物件涵盖该训练区块的一正确信心分数,其中该影像标记数据包含该训练物件在该训练影像中的一位置信息;以及
该计算装置通过该训练影像、该多个正确信心分数以及该影像标记数据训练一深度学习模型,以产生该物件侦测模型。
7.如权利要求6所述的方法,其特征在于,该计算装置是依据该切割精细度以将该训练影像划分为该多个训练区块,且该切割精细度是由该计算装置的一使用者提供。
8.如权利要求6所述的方法,其特征在于,于训练该深度学习模型时还包含:
该计算装置针对各该训练区块计算一推论信心分数,其中该多个推论信心分数与该多个正确信心分数皆为介于零和一之间的实数;
该计算装置计算各该推论信心分数与相应的各该正确信心分数的一误差值;
该计算装置针对非为零的各该推论信心分数,通过一边缘强调函数调整相应的该误差值,其中该边缘强调函数针对愈小的该推论信心分数所对应的该误差值的调整幅度愈大;以及
该计算装置依据该多个误差值调整该深度学习模型。
9.如权利要求7所述的方法,其特征在于,该位置信息包含在该训练影像中包围该训练物件的一矩形的一坐标信息,且该信心分数转换函数是如下所示:
其中,「Ci,j」为该多个正确...
【专利技术属性】
技术研发人员:陈彦霖,陈修志,张杰闵,余兆伟,李孟灿,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。