人脸数据集的构建方法、系统及计算机可读存储介质技术方案

技术编号:26067004 阅读:21 留言:0更新日期:2020-10-28 16:40
本发明专利技术公开了一种人脸数据集的构建方法、系统及计算机可读存储介质,该方法的步骤包括:获取视频数据源,基于视频数据源确定各个时间分区中的人脸数据,并基于人脸数据提取视频数据源中对应的特征信息和属性信息;基于特征信息和属性信息确定各个时间分区中人脸数据对应的标注数据,并基于各个标注数据确定各个时间分区对应的融合特征;基于融合特征确定各个时间分区中的共同数据类,并基于共同数据类构建人脸数据对应的人脸数据集。本发明专利技术通过获取视频数据源,确定人脸数据、特征信息和属性信息,基于特征信息和属性信息确定各个时间分区中标注数据和融合特征,从而构建人脸数据集,从而提升了人脸数据集构建效率、以及人脸数据的多样性。

【技术实现步骤摘要】
人脸数据集的构建方法、系统及计算机可读存储介质
本专利技术涉及人脸标注识别领域,尤其涉及视频流的人脸检测、提取、聚类标注等
,尤其涉及一种人脸数据集的构建方法、系统及计算机可读存储介质。
技术介绍
目前人脸数据集构建方法主要有网络名人的人脸数据集构建方法和固定受试者的人脸数据集构建方法,固定受试者的人脸数据集构建方法主要是在封闭式受限环境下,针对特定的任务而构建的,这种方法构建的人脸数据集中人脸数据规模小、构建周期长以及耗费成本高。网络名人的人脸数据集构建方法中的人脸数据主要来源于明星、运动员等其他公众人物,可通过爬虫技术获取人脸数据构建人脸数据集,但是通过爬虫技术爬取的人脸数据质量差别大、筛选成本较高,由此可知,目前人脸数据集构建方法的构建效率低、以及人脸数据的多样性低。
技术实现思路
本专利技术的主要目的在于提供一种人脸数据集的构建方法、系统及计算机可读存储介质,旨在解决目前人脸数据集构建方法的构建效率低、以及人脸数据的多样性低的技术问题。为实现上述目的,本专利技术提供一种人脸数据集的构建方法,所述人脸数据集的构建方法包括以下步骤:获取视频数据源,基于所述视频数据源确定各个时间分区中的人脸数据,并基于所述人脸数据提取所述视频数据源中对应的特征信息和属性信息;基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据,并基于各个所述标注数据确定各个所述时间分区对应的融合特征;基于所述融合特征确定各个所述时间分区中的共同数据类,并基于所述共同数据类构建所述人脸数据对应的人脸数据集。可选地,所述基于所述融合特征确定各个所述时间分区中的共同数据类,并基于所述共同数据类构建所述人脸数据对应的人脸数据集的步骤包括:在各个所述时间分区中获取相邻时间分区,并在所述融合特征中确定所述相邻时间分区对应的第一融合特征和第二融合特征;基于所述第一融合特征和所述第二融合特征将所述相邻时间分区对应的人脸数据进行区间聚类,确定所述相邻时间分区对应的共同数据类;获取所述共同数据类的候选结果,基于所述候选结果构建所述人脸数据对应的人脸数据集。可选地,所述获取所述共同数据类的候选结果,基于所述候选结果构建所述人脸数据对应的人脸数据集的步骤包括:获取所述共同数据类的候选结果,并通过第一预设检测方式检测所述候选结果是否为预设候选结果;若通过所述第一预设检测方式检测到候选结果为所述预设候选结果,则通过预设构建方式构建所述人脸数据对应的人脸数据集。可选地,所述若通过所述第一预设检测方式检测到候选结果为所述预设候选结果,则通过预设构建方式构建所述人脸数据对应的人脸数据集的步骤包括若通过所述第一预设检测方式检测到候选结果为所述预设候选结果,则获取所述共同数据类中的各个第一人脸数据,并检测在各个所述第一人脸数据中是否存在第一目标人脸数据,其中,所述第一目标人脸数据对应的数据个数是否大于预设个数;若检测到存在所述第一目标人脸数据,则确定所述第一目标人脸数据对应的属性,并将各个所述第一目标人脸数据进行整理并标注,构建所述人脸数据对应的人脸数据集。可选地,所述基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据,并基于各个所述标注数据确定各个所述时间分区对应的融合特征的步骤包括:基于所述属性信息将所述特征信息进行属性划分,得到各个所述时间分区对应的各个属性分区,基于各个所述属性分区确定对应的第三融合特征;基于各个所述第三融合特征确定第四融合特征,并基于所述第四融合特征将各个所述时间分区中的人脸数据进行区内聚类标注,得到各个所述时间分区对应的标注数据;通过第二预设检测方式检测所述标注数据的数据特性,基于检测结果调整各个所述时间分区对应的标注数据,基于调整后的标注数据确定各个所述时间分区对应的融合特征。可选地,所述基于各个所述属性分区确定对应的第三融合特征的步骤包括:将各个所述属性分区中的各个所述特征信息进行两两对比,得到对应的相似度,并检测所述相似度是否大于或者等于预设相似度阈值;若检测到所述相似度大于或者等于所述预设相似度阈值,则获取所述相似度对应的第一特征信息的第一特征编号和第二特征信息的第二特征编号,得到特征编号对;将各个所述属性分区中的各个所述特征编号对进行串接,得到各个所述属性分区对应的特征类,基于所述特征类确定第三融合特征。可选地,所述基于所述第四融合特征将各个所述时间分区中的人脸数据进行区内聚类标注,得到各个所述时间分区对应的标注数据的步骤包括:基于所述第四融合特征获取各个所述时间分区中的第三特征信息,以及获取所述第三特征信息对应第三特征编号,并基于各个所述第三特征编号确定各个所述时间分区中的第二人脸数据;将各个所述时间分区中的第二人脸数据进行区内聚类,并将区内聚类后的各个所述第二人脸数据标注为同类序列,得到各个所述时间分区对应的标注数据。可选地,所述获取视频数据源,基于所述视频数据源确定各个时间分区中的人脸数据,并基于所述人脸数据提取所述视频数据源中对应的特征信息和属性信息的步骤包括:获取所述视频数据源,间隔预设帧数截取所述视频数据源,得到所述视频数据源对应的分帧数据,并检测各个所述时间分区中的各个所述分帧数据是否存在目标分帧数据,其中,所述目标分帧数据中包含有人脸图像;若检测到存在所述目标分帧数据,则基于所述目标分帧数据确定所述视频数据源中各个所述时间分区的各个人脸数据,并将各个所述人脸数据输入预设数据模型中,得到各个所述人脸数据对应的质量分值;检测在各个所述人脸数据中是否存在第二目标人脸数据,其中所述第二目标人脸数据对应的质量分值大于或者等于预设分数值;若检测到存在所述第二目标人脸数据,则基于所述第二目标人脸数据提取所述视频数据源中对应的特征信息和属性信息。此外,为实现上述目的,本专利技术还提供一种人脸数据集的构建系统,所述人脸数据集的构建系统包括存储器、处理器和存储在所述存储器上并在所述处理器上运行的人脸数据集的构建程序,所述人脸数据集的构建程序被所述处理器完成时实现如上所述的人脸数据集的构建方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有人脸数据集的构建程序,所述人脸数据集的构建程序被处理器完成时实现如上所述的人脸数据集的构建方法的步骤。本专利技术实现通过获取视频数据源,然后基于视频数据源确定对应的人脸数据,并基于人脸数据提取视频数据源中对应的特征信息和属性信息,基于特征信息和属性信息确定各个时间分区中人脸数据对应的标注数据,并基于各个标注数据确定各个时间分区对应的融合特征,基于融合特征确定各个时间分区中的共同数据类,并基于共同数据类构建人脸数据对应的人脸数据集。由此可知,本专利技术在确定人脸数据的过程中,通过获取视频数据源,基于视频数据源确定对应的人脸数据的,在视频数据源中包含有人脸各种姿态、人脸连贯动作信息和人脸各异表情等等本文档来自技高网...

【技术保护点】
1.一种人脸数据集的构建方法,其特征在于,所述人脸数据集的构建方法包括以下步骤:/n获取视频数据源,基于所述视频数据源确定各个时间分区中的人脸数据,并基于所述人脸数据提取所述视频数据源中对应的特征信息和属性信息;/n基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据,并基于各个所述标注数据确定各个所述时间分区对应的融合特征;/n基于所述融合特征确定各个所述时间分区中的共同数据类,并基于所述共同数据类构建所述人脸数据对应的人脸数据集。/n

【技术特征摘要】
1.一种人脸数据集的构建方法,其特征在于,所述人脸数据集的构建方法包括以下步骤:
获取视频数据源,基于所述视频数据源确定各个时间分区中的人脸数据,并基于所述人脸数据提取所述视频数据源中对应的特征信息和属性信息;
基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据,并基于各个所述标注数据确定各个所述时间分区对应的融合特征;
基于所述融合特征确定各个所述时间分区中的共同数据类,并基于所述共同数据类构建所述人脸数据对应的人脸数据集。


2.如权利要求1所述的人脸数据集的构建方法,其特征在于,所述基于所述融合特征确定各个所述时间分区中的共同数据类,并基于所述共同数据类构建所述人脸数据对应的人脸数据集的步骤包括:
在各个所述时间分区中获取相邻时间分区,并在所述融合特征中确定所述相邻时间分区对应的第一融合特征和第二融合特征;
基于所述第一融合特征和所述第二融合特征将所述相邻时间分区对应的人脸数据进行区间聚类,确定所述相邻时间分区对应的共同数据类;
获取所述共同数据类的候选结果,基于所述候选结果构建所述人脸数据对应的人脸数据集。


3.如权利要求2所述的人脸数据集的构建方法,其特征在于,所述获取所述共同数据类的候选结果,基于所述候选结果构建所述人脸数据对应的人脸数据集的步骤包括:
获取所述共同数据类的候选结果,并通过第一预设检测方式检测所述候选结果是否为预设候选结果;
若通过所述第一预设检测方式检测到候选结果为所述预设候选结果,则通过预设构建方式构建所述人脸数据对应的人脸数据集。


4.如权利要求3所述的人脸数据集的构建方法,其特征在于,所述若通过所述第一预设检测方式检测到候选结果为所述预设候选结果,则通过预设构建方式构建所述人脸数据对应的人脸数据集的步骤包括:
若通过所述第一预设检测方式检测到候选结果为所述预设候选结果,则获取所述共同数据类中的各个第一人脸数据,并检测在各个所述第一人脸数据中是否存在第一目标人脸数据,其中,所述第一目标人脸数据对应的数据个数是否大于预设个数;
若检测到存在所述第一目标人脸数据,则确定所述第一目标人脸数据对应的属性,并将各个所述第一目标人脸数据进行整理并标注,构建所述人脸数据对应的人脸数据集。


5.如权利要求1所述的人脸数据集的构建方法,其特征在于,所述基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据,并基于各个所述标注数据确定各个所述时间分区对应的融合特征的步骤包括:
基于所述属性信息将所述特征信息进行属性划分,得到各个所述时间分区对应的各个属性分区,基于各个所述属性分区确定对应的第三融合特征;
基于各个所述第三融合特征确定第四融合特征,并基于所述第四融合特征将各个所述时间分区中的人脸数据进行区内聚类标注,得到各个所述时间分区对应的标注数据;
通过第二预设检测方式...

【专利技术属性】
技术研发人员:刘峰朱金华王强蔡振伟陈婷熊凡
申请(专利权)人:深圳力维智联技术有限公司南京中兴力维软件有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1