人脸数据的采集方法、装置、计算机可读介质及系统制造方法及图纸

技术编号:20589658 阅读:57 留言:0更新日期:2019-03-16 07:23
一种人脸数据的采集方法、装置、计算机可读介质及系统,所述人脸数据的采集方法包括:获取包含人脸数据的视频文件;利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。应用上述方案,可以以较低的成本采集大规模的人脸数据。

【技术实现步骤摘要】
人脸数据的采集方法、装置、计算机可读介质及系统
本专利技术实施例涉及人脸采集领域,尤其涉及一种人脸数据的采集方法、装置、计算机可读介质及系统。
技术介绍
由于人脸识别技术具有方便、安全等优点,越来越受到人们的青睐,对人脸识别技术的研究也越来越多。在实际研究中,基于深度学习方法的人脸识别技术需要大量的训练数据。目前获取人脸训练数据的方法有两种方案:1、通过互联网下载人脸数据,例如首先确定姓名信息等关键字,然后利用搜索引擎抓取相应的图片获得人脸数据。该方案的缺点是获得人脸数据可能包含不同年龄、不同装扮的数据,需要耗费大量的人力成本进行后期整理,尤其是美女明星长得都很相似,很难进行区分。2、设置人脸采集的设施对真实的人脸数据进行采集,该方案的缺点是如果规模较小,采集的人脸数量较少,无法满足深度学习算法的需求,如果规模较大,成本太高。
技术实现思路
本专利技术解决的技术问题是如何以较低的成本采集大规模的人脸数据。为解决上述技术问题,本专利技术实施例提供一种人脸数据的采集方法,所述方法包括:获取包含人脸数据的视频文件;利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。可选地,所述利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据,包括:提取所述视频文件的第一帧作为当前帧;从所述当前帧,直至所述视频文件的倒数第二帧,迭代执行如下步骤:基于当前帧数据对应的人脸,生成新的人脸标识,所述新的人脸标识对应当前帧数据;利用人脸跟踪算法判断后一帧数据对应的人脸与当前帧数据对应的人脸是否为同一个,如果后一帧数据对应的人脸与当前帧数据对应的人脸为同一个,则将后一帧数据增加至所述新的人脸标识对应的数据中;如果后一帧数据对应的人脸与当前帧数据对应的人脸不一致,则提取后一帧作为更新后的所述当前帧。可选地,所述人脸数据的采集方法,还包括:利用人脸识别算法对所述生成的不同人脸标识对应的数据进行处理,将识别算法识别为同一人脸的多个不同人脸标识对应的数据进行合并,生成合并后的不同人脸标识对应的数据。可选地,所述人脸数据的采集方法,还包括:通过人工方式对合并后的不同人脸标识对应的数据进行审核,将属于同一人脸的多个不同人脸标识对应的数据进行合并,将同一个人脸标识对应的不同人脸的数据进行拆分,生成更新后的不同人脸标识对应的数据。可选地,所述人脸数据的采集方法,还包括:采集特殊场合下的人员的人脸数据。本专利技术实施例提供一种人脸数据的采集装置,包括:获取单元,适于获取包含人脸数据的视频文件;生成单元,适于利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。可选地,所述生成单元,包括:提取子单元,适于提取所述视频文件的第一帧作为当前帧;迭代子单元,包括生成模块和判断模块,适于由生成模块和判断模块从所述当前帧,直至所述视频文件的倒数第二帧,迭代执行数据处理,其中:所述生成模块,适于基于当前帧数据对应的人脸,生成新的人脸标识,所述新的人脸标识对应当前帧数据;所述判断模块,适于利用人脸跟踪算法判断后一帧数据对应的人脸与当前帧数据对应的人脸是否为同一个,如果后一帧数据对应的人脸与当前帧数据对应的人脸为同一个,则将后一帧数据增加至所述新的人脸标识对应的数据中;如果后一帧数据对应的人脸与当前帧数据对应的人脸不一致,则提取后一帧作为更新后的所述当前帧。可选地,所述人脸数据的采集装置还包括:第一识别单元,适于利用人脸识别算法对所述生成的不同人脸标识对应的数据进行处理,将识别算法识别为同一人脸的多个不同人脸标识对应的数据进行合并,生成合并后的不同人脸标识对应的数据。可选地,所述人脸数据的采集装置还包括:第二识别单元,适于通过人工方式对合并后的不同人脸标识对应的数据进行审核,将属于同一人脸的多个不同人脸标识对应的数据进行合并,将同一个人脸标识对应的不同人脸的数据进行拆分,生成更新后的不同人脸标识对应的数据。可选地,所述人脸数据的采集装置,还包括:采集单元,适于采集特殊场合下的人员的人脸数据。本专利技术实施例提供一种计算机可读介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种所述方法对应的步骤。本专利技术实施例提供一种采集系统,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一种所述方法对应的步骤。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例通过利用人脸跟踪算法对视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。一方面,利用人脸跟踪算法对不同人脸对应的数据进行分离,成本较低,不需要耗费大量的人力成本进行后期整理;另一方面,通过直接从视频文件中提取出不同的人脸数据,可以实现大规模的采集,成本较低。进一步地,通过采集特殊场景下的人员的人脸数据。例如,通过采集安检卡口身份证上的图片,不仅扩充了人脸数据的样本分布,也方便以后的数据整理。附图说明图1是本专利技术实施例提供的一种人脸数据的采集方法的流程图;图2是本专利技术实施例提供的一种人脸数据的采集装置的示意图。具体实施方式目前获取人脸训练数据的方法有两种方案:1、通过互联网下载人脸数据,例如首先确定姓名信息等关键字,然后利用搜索引擎抓取相应的图片获得人脸数据。该方案的缺点是获得人脸数据可能包含不同年龄、不同装扮的数据,需要耗费大量的人力成本进行后期整理,尤其是美女明星长得都很相似,很难进行区分。2、设置人脸采集的设施对真实的人脸数据进行采集,该方案的缺点是如果规模较小,采集的人脸数量较少,无法满足深度学习算法的需求,如果规模较大,成本太高。本专利技术实施例通过利用人脸跟踪算法对视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。一方面,利用人脸跟踪算法对不同人脸对应的数据进行分离,成本较低,不需要耗费大量的人力成本进行后期整理;另一方面,通过直接从视频文件中提取出不同的人脸数据,可以实现大规模的采集,成本较低。为使本专利技术的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本专利技术的具体实施例做详细的说明。参见图1,本专利技术实施例提供的一种人脸数据的采集方法包括如下步骤:S101,获取包含人脸数据的视频文件。在具体实施中,可以通过多种途径获取包含人脸数据的视频文件,例如,可以通过Internet网络下载公开的允许使用的视频文件,也可以从正规渠道购买光盘获取视频文件,只要对所述视频文件的获取和使用合法,本专利技术实施例不做限制。在具体实施中,可以获取一个包含人脸数据的视频文件,也可以获取多个包含人脸数据的视频文件,视频文件越多,生成的人脸数据越多,相应的处理也越多,可以根据实际需求选择合适的视频文件个数,本专利技术实施例不做限制。S102,利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。在具体实施中,由于视频文件中的人脸数据是连贯的,因此相邻帧的人脸相似度很高,而且姿势的分布也比较均匀,很容易进行跟踪。故可以利用人脸跟踪算法对所述视频文件前后帧的人脸进行跟踪,将同一个人脸对应的数据进行合并,不同人脸的数据进行分离,生成不同人脸标识对应的数据。在本专利技术一实施例中,可以提取所述视频文件的第一帧本文档来自技高网...

【技术保护点】
1.一种人脸数据的采集方法,其特征在于,包括:获取包含人脸数据的视频文件;利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。

【技术特征摘要】
1.一种人脸数据的采集方法,其特征在于,包括:获取包含人脸数据的视频文件;利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。2.根据权利要求1所述的人脸数据的采集方法,其特征在于,所述利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据,包括:提取所述视频文件的第一帧作为当前帧;从所述当前帧,直至所述视频文件的倒数第二帧,迭代执行如下步骤:基于当前帧数据对应的人脸,生成新的人脸标识,所述新的人脸标识对应当前帧数据;利用人脸跟踪算法判断后一帧数据对应的人脸与当前帧数据对应的人脸是否为同一个,如果后一帧数据对应的人脸与当前帧数据对应的人脸为同一个,则将后一帧数据增加至所述新的人脸标识对应的数据中;如果后一帧数据对应的人脸与当前帧数据对应的人脸不一致,则提取后一帧作为更新后的所述当前帧。3.根据权利要求1所述的人脸数据的采集方法,其特征在于,还包括:利用人脸识别算法对所述生成的不同人脸标识对应的数据进行处理,将识别算法识别为同一人脸的多个不同人脸标识对应的数据进行合并,生成合并后的不同人脸标识对应的数据。4.根据权利要求1至3任一项所述的人脸数据的采集方法,其特征在于,还包括:通过人工方式对合并后的不同人脸标识对应的数据进行审核,将属于同一人脸的多个不同人脸标识对应的数据进行合并,将同一个人脸标识对应的不同人脸的数据进行拆分,生成更新后的不同人脸标识对应的数据。5.根据权利要求1所述的人脸数据的采集方法,其特征在于,还包括:采集特殊场合下的人员的人脸数据。6.一种人脸数据的采集装置,其特征在于,包括:获取单元,适于获取包含人脸数据的视频文件;生成单元,适于利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离,生成不同人脸标识对应的数据。7.根据权利要求6所述...

【专利技术属性】
技术研发人员:赵文忠顾红旗
申请(专利权)人:上海银晨智能识别科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1