The invention provides a video face annotation method and system based on community discovery clustering for training data set generation, including: video preprocessing; face detection based on depth network and key point regression; face detection; face blur detection; face feature extraction; face feature similarity matrix; community discovery clustering; manual merging. The advantages of the present invention lie in: automatically determining the number of clustering centers through community discovery clustering, and then merging the automatic clustering results manually, realizing maximum automation and minimal manual participation, so as to efficiently extract high-quality faces from video and construct data sets.
【技术实现步骤摘要】
一种基于社区发现聚类的视频人脸标注方法和系统
本专利技术涉及深度学习训练数据集生成、视频编目
,具体来说涉及一种用于训练数据集生成的基于社区发现聚类的视频人脸标注方法和系统。
技术介绍
目前深度学习在多个应用领域取得了较传统方法突破性的进展,如计算机视觉中的图像分类、物体检测、语义分割等;自然语言处理;推荐系统等。深度学习中使用的卷积神经网络、递归神经网络等需要在数据集上预先训练,而数据集需要进行标注。现有的人脸数据集标注方式有三种,一种是人工标注、另一种是人工辅助标注、又另一种是自动标注。人工标注虽然是目前主流的数据标注方法,且人工标注的准确性有保证,但是人工标注的人工成本和时间成本很高。自动标注一般借助搜索引擎,通过关键词搜索收集图片,用搜索关键词标注。虽然自动标注方法简单,但是收集到的数据集质量很差,数据清洗成本较高。人工辅助标注是介于人工和自动标注之间的一种标注方式。现有技术中的人工辅助标注专利如中国专利公开号CN103530652B提供一种基于人脸聚类的视频编目方法、检索方法及其系统,方法包括以下步骤:对视频文件进行镜头切分;对视频镜头进行人脸检测,得到人脸图片及相关信息;对检测出的人脸图片进行去重;对去重后的人脸图片进行人脸特征提取,将提取到的人脸特征存入人脸特征库;根据人脸特征,对人脸图片进行特征聚类;对人脸类别库中存储的各个人脸类别进行人工标注;根据人工标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,将所述人脸元数据增加到原始编目文件中,得到最终的视频编目文件。具有以下优点:对视频文件进行自动编目,准确高效,大大节省人力; ...
【技术保护点】
1.一种基于社区发现聚类的视频人脸标注方法,用于训练数据集生成,包括:视频预处理,将原始数据解码为按帧的图像,给每帧图像添加时间戳,得到视频帧图像序列;基于深度网络的人脸检测和关键点回归,得到检测出的每个人脸的五个关键点的坐标;正脸检测,以获得清晰的正脸图像;人脸模糊检测,将模糊正脸图像剔除;人脸特征提取,利用训练好的人脸识别网络,对上述清晰的正脸图像提取特征,构成人脸特征集合;计算所述人脸特征集合中两两之间的余弦相似度,得到人脸特征相似度矩阵;基于社区发现聚类,通过使用上述人脸特征相似度矩阵,贪心迭代优化模块度,得到自动聚类结果;将上述聚类结果进行合并,从而实现对视频中人脸的编目,用于构造数据集。
【技术特征摘要】
1.一种基于社区发现聚类的视频人脸标注方法,用于训练数据集生成,包括:视频预处理,将原始数据解码为按帧的图像,给每帧图像添加时间戳,得到视频帧图像序列;基于深度网络的人脸检测和关键点回归,得到检测出的每个人脸的五个关键点的坐标;正脸检测,以获得清晰的正脸图像;人脸模糊检测,将模糊正脸图像剔除;人脸特征提取,利用训练好的人脸识别网络,对上述清晰的正脸图像提取特征,构成人脸特征集合;计算所述人脸特征集合中两两之间的余弦相似度,得到人脸特征相似度矩阵;基于社区发现聚类,通过使用上述人脸特征相似度矩阵,贪心迭代优化模块度,得到自动聚类结果;将上述聚类结果进行合并,从而实现对视频中人脸的编目,用于构造数据集。2.根据权利要求1所述的一种基于社区发现聚类的视频人脸标注方法,其特征在于,所述原始数据为监控设备经过网络传输过来的监控视频流数据或者将前者保存在磁盘上的视频文件数据。3.根据权利要求1所述的一种基于社区发现聚类的视频人脸标注方法,其特征在于,所述五个关键点为人脸上的左眼左眼角,右眼右眼角,鼻尖,左嘴角和右嘴角。4.根据权利要求1所述的一种基于社区发现聚类的视频人脸标注方法,其特征在于,所述正脸检测包括以下步骤:基于哈尔特征的正脸检测,将基于深度网络的人脸检测得到的人脸输入训练好的分类器,去掉不是正脸的人脸及误检为人脸的其他目标;基于姿态估计的正脸检测,将基于哈尔特征的正脸检测过程判定为正脸的关键点坐标,使用姿态估计方法,估计当前正脸的姿态;利用估计出来的姿态,通过预定义的第一阈值,控制低头、仰脸、侧脸情况,得到过滤后的清晰的正脸图像。5.根据权利要求1所述的一种基于社区发现聚类的视频人脸标注方法,其特征在于,所述模糊正脸图像为拉普拉斯响应值低于第二阈值的图像。6.根据权利要求1所述的一种基于社区发现聚类的视频人脸...
【专利技术属性】
技术研发人员:陈俊逸,
申请(专利权)人:长沙小钴科技有限公司,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。