人脸数据集的构建方法、系统及计算机可读存储介质技术方案

技术编号：26067004 阅读：21 留言：0更新日期：2020-10-28 16:40

本发明专利技术公开了一种人脸数据集的构建方法、系统及计算机可读存储介质，该方法的步骤包括：获取视频数据源，基于视频数据源确定各个时间分区中的人脸数据，并基于人脸数据提取视频数据源中对应的特征信息和属性信息；基于特征信息和属性信息确定各个时间分区中人脸数据对应的标注数据，并基于各个标注数据确定各个时间分区对应的融合特征；基于融合特征确定各个时间分区中的共同数据类，并基于共同数据类构建人脸数据对应的人脸数据集。本发明专利技术通过获取视频数据源，确定人脸数据、特征信息和属性信息，基于特征信息和属性信息确定各个时间分区中标注数据和融合特征，从而构建人脸数据集，从而提升了人脸数据集构建效率、以及人脸数据的多样性。

全部详细技术资料下载

【技术实现步骤摘要】
人脸数据集的构建方法、系统及计算机可读存储介质
本专利技术涉及人脸标注识别领域，尤其涉及视频流的人脸检测、提取、聚类标注等
，尤其涉及一种人脸数据集的构建方法、系统及计算机可读存储介质。
技术介绍
目前人脸数据集构建方法主要有网络名人的人脸数据集构建方法和固定受试者的人脸数据集构建方法，固定受试者的人脸数据集构建方法主要是在封闭式受限环境下，针对特定的任务而构建的，这种方法构建的人脸数据集中人脸数据规模小、构建周期长以及耗费成本高。网络名人的人脸数据集构建方法中的人脸数据主要来源于明星、运动员等其他公众人物，可通过爬虫技术获取人脸数据构建人脸数据集，但是通过爬虫技术爬取的人脸数据质量差别大、筛选成本较高，由此可知，目前人脸数据集构建方法的构建效率低、以及人脸数据的多样性低。
技术实现思路
本专利技术的主要目的在于提供一种人脸数据集的构建方法、系统及计算机可读存储介质，旨在解决目前人脸数据集构建方法的构建效率低、以及人脸数据的多样性低的技术问题。为实现上述目的，本专利技术提供一种人脸数据集的构建方法，所述人脸数据集的构建方法包括以下步骤：获取视频数据源，基于所述视频数据源确定各个时间分区中的人脸数据，并基于所述人脸数据提取所述视频数据源中对应的特征信息和属性信息；基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据，并基于各个所述标注数据确定各个所述时间分区对应的融合特征；基于所述融合特征确定各个所述时间分区中的共同数据类，并基于所述共同数...

【技术保护点】
1.一种人脸数据集的构建方法，其特征在于，所述人脸数据集的构建方法包括以下步骤：/n获取视频数据源，基于所述视频数据源确定各个时间分区中的人脸数据，并基于所述人脸数据提取所述视频数据源中对应的特征信息和属性信息；/n基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据，并基于各个所述标注数据确定各个所述时间分区对应的融合特征；/n基于所述融合特征确定各个所述时间分区中的共同数据类，并基于所述共同数据类构建所述人脸数据对应的人脸数据集。/n

【技术特征摘要】
1.一种人脸数据集的构建方法，其特征在于，所述人脸数据集的构建方法包括以下步骤：
获取视频数据源，基于所述视频数据源确定各个时间分区中的人脸数据，并基于所述人脸数据提取所述视频数据源中对应的特征信息和属性信息；
基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据，并基于各个所述标注数据确定各个所述时间分区对应的融合特征；
基于所述融合特征确定各个所述时间分区中的共同数据类，并基于所述共同数据类构建所述人脸数据对应的人脸数据集。

2.如权利要求1所述的人脸数据集的构建方法，其特征在于，所述基于所述融合特征确定各个所述时间分区中的共同数据类，并基于所述共同数据类构建所述人脸数据对应的人脸数据集的步骤包括：
在各个所述时间分区中获取相邻时间分区，并在所述融合特征中确定所述相邻时间分区对应的第一融合特征和第二融合特征；
基于所述第一融合特征和所述第二融合特征将所述相邻时间分区对应的人脸数据进行区间聚类，确定所述相邻时间分区对应的共同数据类；
获取所述共同数据类的候选结果，基于所述候选结果构建所述人脸数据对应的人脸数据集。

3.如权利要求2所述的人脸数据集的构建方法，其特征在于，所述获取所述共同数据类的候选结果，基于所述候选结果构建所述人脸数据对应的人脸数据集的步骤包括：
获取所述共同数据类的候选结果，并通过第一预设检测方式检测所述候选结果是否为预设候选结果；
若通过所述第一预设检测方式检测到候选结果为所述预设候选结果，则通过预设构建方式构建所述人脸数据对应的人脸数据集。

4.如权利要求3所述的人脸数据集的构建方法，其特征在于，所述若通过所述第一预设检测方式检测到候选结果为所述预设候选结果，则通过预设构建方式构建所述人脸数据对应的人脸数据集的步骤包括：
若通过所述第一预设检测方式检测到候选结果为所述预设候选结果，则获取所述共同数据类中的各个第一人脸数据，并检测在各个所述第一人脸数据中是否存在第一目标人脸数据，其中，所述第一目标人脸数据对应的数据个数是否大于预设个数；
若检测到存在所述第一目标人脸数据，则确定所述第一目标人脸数据对应的属性，并将各个所述第一目标人脸数据进行整理并标注，构建所述人脸数据对应的人脸数据集。

5.如权利要求1所述的人脸数据集的构建方法，其特征在于，所述基于所述特征信息和所述属性信息确定各个所述时间分区中人脸数据对应的标注数据，并基于各个所述标注数据确定各个所述时间分区对应的融合特征的步骤包括：
基于所述属性信息将所述特征信息进行属性划分，得到各个所述时间分区对应的各个属性分区，基于各个所述属性分区确定对应的第三融合特征；
基于各个所述第三融合特征确定第四融合特征，并基于所述第四融合特征将各个所述时间分区中的人脸数据进行区内聚类标注，得到各个所述时间分区对应的标注数据；
通过第二预设检测方式...

【专利技术属性】
技术研发人员：刘峰，朱金华，王强，蔡振伟，陈婷，熊凡，
申请(专利权)人：深圳力维智联技术有限公司，南京中兴力维软件有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人