一种人脸图像的性别标注方法及人脸性别检测方法技术

技术编号:10106688 阅读:308 留言:0更新日期:2014-06-01 21:29
本发明专利技术公开了一种人脸图像的性别标注方法及人脸性别检测方法。本检测方法为:1)获取人脸图片及其上下文信息;2)对获取的每一待标注人脸图片的性别进行标注:从该图片的上下文信息中提取候选的人名关键词,在网络中搜索返回结果网页;根据该结果网页中性别相关词语的词频确定该图片的性别;分别采用人脸技术平台和人脸属性分析算法检测该图片的性别;综合上述识别结果标注该图片的性别;3)提取每一性别标注图片的特征向量,利用机器学习算法对性别标注后的人脸图片进行训练,生成一人脸性别识别模型;4)对于待检测人脸图像,提取其特征向量利用所述人脸性别识别模型对其性别进行检测。本发明专利技术大大提高了人脸图像标注的效率和性别检测效率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了。本检测方法为:1)获取人脸图片及其上下文信息;2)对获取的每一待标注人脸图片的性别进行标注:从该图片的上下文信息中提取候选的人名关键词,在网络中搜索返回结果网页;根据该结果网页中性别相关词语的词频确定该图片的性别;分别采用人脸技术平台和人脸属性分析算法检测该图片的性别;综合上述识别结果标注该图片的性别;3)提取每一性别标注图片的特征向量,利用机器学习算法对性别标注后的人脸图片进行训练,生成一人脸性别识别模型;4)对于待检测人脸图像,提取其特征向量利用所述人脸性别识别模型对其性别进行检测。本专利技术大大提高了人脸图像标注的效率和性别检测效率。【专利说明】
本专利技术涉及一种人脸属性特征标注方法,尤其涉及,属于图像识别

技术介绍
目前人脸识别检测技术在各领域得到广泛应用,成为当前的一项研究热点,比如申请号201210313721.9、名称“人脸识别方法”的专利文献,申请号201210310643.7、名称“一种人脸识别方法及其系统”的专利文献。其中,人脸检测识别方法中人脸特征点的提取和标注是一项必不可少的工作,t匕如申请号201310115471.2、名称“一种人脸自动标注方法及系统”首先从截取的视频中检测出人脸,获取人脸图片集合,然后过滤出人脸图片集合,同时,获取相邻帧图片的HSV颜色直方图差值,采用空间颜色直方图的镜头边缘检测算法进行镜头分割,对来自相邻帧的人脸,检测第一帧的目标区域内角点,并使用局部匹配的方法将这些角点递延给下一帧,并进行相应的更新,并统计匹配个数,依据匹配个数的阈值,依此进行下去获取人脸序列。然后通过唇动检测模块根据人脸序列中说话人的唇动检测出说话人和未说话人,将说话人、说话内容及说话时间三者融合进行标注;最后,读入每个序列上的人脸,逐个定位,再根据定位结果进行仿射变换,并提取变换后特征点附近固定大小圆形区域内的像素灰度值,作为该人脸特征。申请号200610096709.1,名称“人脸识别系统中的人脸特征点定位方法”也涉及人脸识别系统中的人脸特征点定位方法,利用图像梯度方向信息的统计模型,通过统计推理的方法确定人脸特征点,包括以下步骤:(I)定义及定位人脸特征点,即利用图像梯度的方向定义和定位候选人的人脸特征点;(2)提取步骤(I)中人脸特征点的特征向量(3)利用一个考虑了人脸特征点的特征及相对关系的统计模型,采用统计推理的方法,标注人脸特征点,从而确定需要的人脸特征点的位置。现有人脸属性分析技术包含性别,年龄,种族,微笑程度,朝向等一系列技术。这些技术一般共用一套标准的机器学习算法。相关算法通常包含三个环节:1)人脸图像预处理,包含人脸检测和光学校正;2)人脸特征提取,提取相关像素值,边缘位置,角点等;3)机器学习分类器,针对人脸特征进行属性判定,如性别是男性还是女性。传统技术的最大问题在于很强的依赖于训练数据,因而推广性较弱。举例来说,一个在中国人人脸数据上训练出来的性别分类器,在判定白人和黑人性别时往往就会出现较大误差。因而,提升现有人脸属性分析算法最核心的步骤就是如何快速高效的收集及标注海量的人脸图片。人脸技术属于机器学习范畴,技术和系统都需要经历数据训练过程,即把大量人脸图像和相应的标注一起作为输入给到算法,算法会根据这些训练数据自动学习出相应的模型从而用于实际应用。由于目前的人脸检测方法所要求检测的特征属性信息要求越来越丰富,一般通过有标注的人脸图像利用机器学习算法进行训练得到识别模型,从而对众多未标注的人脸图像进行标注和识别。然而关于人脸性别属性特征的标注方法一直未得到有效解决,如果简单的通过人工方法去逐一筛选标注,非常耗时。
技术实现思路
针对现有技术中存在的问题,本专利技术的目的在于提供。本专利技术的技术方案为:一种人脸图像的性别标注方法,其步骤为:I)从待标注人脸图片的图像来源上下文信息中提取候选的人名关键词;2)根据所提取的人名关键词在网络中进行搜索,返回结果网页;3)在该结果网页中计算设定的性别相关词语的出现频率,并根据该出现频率初步确定该待标注人脸图片的性别;4)分别采用人脸技术平台和人脸属性分析算法检测该待标注人脸图片的性别;5)根据步骤3)、4)的识别结果确定该待标注人脸图片的最终性别,标注该待标注人脸图片的性别。进一步的,根据步骤3)的性别识别结果、人脸技术平台的性别识别结果和人脸属性分析算法的性别识别结果进行加权求和,得到一 L值,根据该L值与设定阈值的比较结果确定该待标注人脸图片的最终性别。进一步的,根据历史最终性别标注结果,分别统计步骤3)的历史性别识别结果准确率、人脸技术平台的历史性别识别结果准确率和人脸属性分析算法的历史性别识别结果准确率,根据统计结果调整相应的权重。进一步的,在维基百科和百度百科中搜索候选的人名关键词,得到结果网页。一种人脸图像的人脸性别检测方法,其步骤为:I)数据自动采集系统从服务器获取人脸图片及其上下文信息;2)数据自动标注系统对获取的每一待标注人脸图片的性别进行标注;其中标注方法为:21)从待标注人脸图片的图像来源上下文信息中提取候选的人名关键词;22)根据所提取的人名关键词在网络中进行搜索,返回结果网页;23)在该结果网页中计算设定的性别相关词语的出现频率,并根据该出现频率初步确定该待标注人脸图片的性别;24)分别采用人脸技术平台和人脸属性分析算法检测该待标注人脸图片的性别;25)根据步骤23)、24)的识别结果确定该待标注人脸图片的最终性别,标注该待标注人脸图片的性别;3)提取每一性别标注图片的特征向量,自动算法训练系统利用机器学习算法定期对性别标注后的人脸图片进行训练,生成一人脸性别识别模型;4)对于待检测人脸图像,提取其特征向量利用所述人脸性别识别模型对其性别进行检测。根据步骤23)的性别识别结果、人脸技术平台的性别识别结果和人脸属性分析算法的性别识别结果进行加权求和,得到一 L值,根据该L值与设定阈值的比较结果确定该待标注人脸图片的最终性别。进一步的,所述数据自动采集系统从服务器获取人脸图片及其上下文信息的方法为:71)所述服务器根据输入的人脸关键字搜索相应的人脸图片文件并保存;72)计算每一人脸图片文件的哈希码、颜色直方图、上下文和标签信息;73)将每一人脸图片与已存人脸图片进行哈希码和颜色直方图比对,去除重复的图像;74)使用人脸检测算法模块检测步骤73)处理后保留的每一人脸图片,将人脸位置信息保存到数据库;使用人脸关键点定位算法定位人脸上的关键点信息并保存到数据库。进一步的,所述特征向量包括人脸图像的颜色、梯度、边缘、角点特征。进一步的,提取所述特征向量的方法为:首先在人脸图片中检测出人脸位置,然后在人脸区域中提取颜色、梯度、边缘、角点特征数据并将其连接成一个特征向量,得到所述特征向量。本专利技术检测系统如图1所示,其检测方法包含如下步骤:I)数据自动采集系统,自动从搜索引擎,社交网络,和拍照相册类应用后台服务器不断挖掘学习算法所需要的人脸数据和相关上下文信息;2)数据自动标注系统,通过少量人工干预,自动过滤采集数据中的噪声,并利用上下文信息自动挖掘学习算法所需要的标注信息;3)自动算法训练系统,在获得了自动挖掘出的人脸数据和标注信息,该系统定期自动的将数据送本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/201410053395.html" title="一种人脸图像的性别标注方法及人脸性别检测方法原文来自X技术">人脸图像的性别标注方法及人脸性别检测方法</a>

【技术保护点】
一种人脸图像的性别标注方法,其步骤为:1)从待标注人脸图片的图像来源上下文信息中提取候选的人名关键词;2)根据所提取的人名关键词在网络中进行搜索,返回结果网页;3)在该结果网页中计算设定的性别相关词语的出现频率,并根据该出现频率初步确定该待标注人脸图片的性别;4)分别采用人脸技术平台和人脸属性分析算法检测该待标注人脸图片的性别;5)根据步骤3)、4)的识别结果确定该待标注人脸图片的最终性别,标注该待标注人脸图片的性别。

【技术特征摘要】

【专利技术属性】
技术研发人员:印奇曹志敏姜宇宁
申请(专利权)人:北京旷视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1