【技术实现步骤摘要】
一种基于同源余弦损失函数的人物识别方法
本专利技术涉及人物识别领域,尤其是涉及了一种基于同源余弦损失函数的人物识别方法。
技术介绍
随着智能手机和数码相机的出现,人们通过拍摄更多的照片来记录日常生活和故事,因此人们希望能够识别个人数据,如从社交媒体或互联网的成千上万个图像中的识别不同时间和空间的同一个人。人物识别涵盖了数字图像处理、神经网络、计算机视觉以及人工智能等各个方面的内容,在公安、金融、网络安全、物业管理、考勤制度以及人们日常相册整理等都有广泛的应用。多人物中的人脸识别则可以应用在机场、火车站等人流量密集的场所,可以在密集的人群中识别出目标人物,如可疑人员等,这对提高公共安全有着重要作用。然而,由于受到非正面、光和照明的变化,外观的变化等因素的影响,在无约束环境中的人物识别仍然是一个具有挑战性的问题。本专利技术提出了一种基于同源余弦损失函数的人物识别方法,先为头部标记真实数据,并检测脸部和身体区域,接着使用人物姿态估计器进行人物姿态估计,识别人体关键部位,从而找到上身区域,再将每个区域(补丁)对齐到基本位置,减轻内部类别的差异,然后送入深度模型,获得有代表 ...
【技术保护点】
一种基于同源余弦损失函数的人物识别方法,其特征在于,主要包括为头部标记真实数据并检测脸部和身体区域(一);姿态估计(二);补丁对齐并送入深度模型(三);使用同源余弦损失函数训练深度模型(四)。
【技术特征摘要】
1.一种基于同源余弦损失函数的人物识别方法,其特征在于,主要包括为头部标记真实数据并检测脸部和身体区域(一);姿态估计(二);补丁对齐并送入深度模型(三);使用同源余弦损失函数训练深度模型(四)。2.基于权利要求书1所述的为头部标记真实数据并检测脸部和身体区域(一),其特征在于,用四个区域的特征r∈{1,…,4},即脸、头、全身和上身来识别一个人;每个区域遵循训练和特征提取程序;在区域建议网络(RPN)中预先训练脸部检测器;使用残差网络模型,删除图层并添加分类和回归两个损失函数;对训练集的脸部模型进行分类;脸部检测器识别脸部(眼睛、眉毛、嘴巴等)的m个关键点,并且通过平移、旋转和缩放让检测到的脸部补丁对准“基本”形状;令分别表示由脸部模型和对准结果检测的m个关键点;将P,Q定义为两个仿射空间,然后将仿射变换定义为:其中,是P中的线性变换矩阵,是Q中的偏差;如果关键点的置信度低于某个阈值,则不依赖于这样的点来对齐补丁;当关键点的数量小于3时,取基于头部的基本真值来对齐补丁,因为至少需要三个点才可以确定仿射变换。3.基于权利要求书2所述的身体区域检测,其特征在于,为了检测身体部分,在RPN框架中预先训练检测器;网络结构是一个初始模型,最终的池层由完全连接的层替代。4.基于权利要求书1所述的姿态估计(二),其特征在于,通过人体姿态估计识别身体的关键点,确定上半身区域,从而通过这些点定位上身部分。5.基于权利要求书1所述的补丁对齐并送入深度模型(三),其特征在于,通过将每个区域(补丁)对齐到人体的基本位置,从而减轻内部类别的差异,然后将对齐的补丁送入深度模型,获得有代表性和鲁棒的特征。6.基于权利要求书1所述的使用同源余弦损失函数训练深度模型(四),其特征在于,使用同源余弦损失函数具有代表性的深层特征,能更好...
【专利技术属性】
技术研发人员:夏春秋,
申请(专利权)人:深圳市唯特视科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。